![]() |
1
0
在这里,我尝试遵循一种通用方法,即不必在代码中预先编程列跨距。要返回数据帧,可以使用pd。用stringio阅读csv。请根据您的文件位置修改路径。这段代码是从你的代码中扩展出来的,让你更容易理解,否则还有更有效的方法来编写同样的逻辑
要将元组列表转换为pyspark dataframe,下面是一个教程 http://bigdataplaybook.blogspot.in/2017/01/create-dataframe-from-list-of-tuples.html |
![]() |
2
0
从数据集中可以看出,字段中的文本长度是可变的,字段本身以固定位置开始和结束。这通常发生在制表符分隔的字段中。
如果是这种情况,则应采取以下措施:
我换了
或者,如果输入文件不是以制表符分隔的,则可以根据固定长度字段提取字段值,然后执行
|
![]() |
Vasu Mistry · 如何用字符串值解析yaml文件 2 年前 |
![]() |
kopew · 索引器:列表索引超出api的范围 2 年前 |
![]() |
Atefeh Hedayati · 如何使用矩阵乘法简化循环? 2 年前 |
![]() |
wayoh22 · 检查部分值和返回全部值的列表 2 年前 |
![]() |
arwind mohan kmm · Python中的图像拆分器 3 年前 |
![]() |
Cranjis · 网址。解析Python2。7相当于 6 年前 |