簡體   English   中英

無法在 pyspark 中導入 csv

[英]Unable to import csv in pyspark

我正在嘗試將 csv 導入數據幀,但無法做到這一點。 這是代碼。

csv_2_df = spark.read.csv("home/jovyan/oneDay.csv").option("inferSchema","true").option("mode", "DROPMALFORMED")

當我嘗試運行上面的代碼時,出現以下錯誤

 'Path does not exist: file:/home/jovyan/oneDay.csv;'

在這里設置上下文我試圖在一個 jupyter docker 文件中這樣做,其中根設置為 /home/jovyan/ 並且我已經上傳了我的 csv 文件。 我在這里要做的就是加載 csv ,我可以使用 textfile API 來做到這一點

data = sc.textFile('/home/jovyan/oneDay.csv') 

但我正在嘗試使用 CSV API,因為它讓我可以選擇刪除格式錯誤的行。 任何幫助表示贊賞。

正如@cronoik 所評論的,嘗試在您的路徑中添加一個正斜杠:

csv_2_df = spark.read.csv("/home/jovyan/oneDay.csv").option("inferSchema","true").option("mode", "DROPMALFORMED")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM