[英]How can I insert data from a CSV file into a dataframe using pandas.read_csv?
[英]Read csv file into a dataframe and access it using scala
我有一個 csv 文件,其中包含如下數據 -
a1, 1
a2, 2
a3, 3
當我像 filter(a1)._2 那樣為 a1 放置過濾器時,我想得到輸出為 1 。
所以確切的語法將取決於您的特定版本的 Spark。 在 Spark v2.4.3 中,你會這樣做:
val df: DataFrame = sparkSession.sqlContext.read.option("header",
"false").csv("/path/to/some.csv")
從那里你可以應用數據框操作來過濾你的數據:
df.select($"_c1").filter($"_c0" === "a1").show
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.