繁体   English   中英

Pyspark:如何读取.csv文件?

[英]Pyspark: how to read a .csv file?

我正在尝试读取具有奇怪格式的.csv 文件。

这就是我正在做的

df =  spark.read.format('csv').option("header", "true").option("delimiter", ',').load("muyFile.csv"))
df.show(5)

在此处输入图像描述

我不明白为什么第三个id的lonlat条目被转置。 该文件似乎有两个不同的分隔符。 您的帮助将不胜感激!

您的标签字段可能包含逗号作为被视为分隔符的值。 将您的数据括在引号或任何其他引号字符中(记住 set.option('quote',''))并再次读取数据。 它应该工作

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM