簡體   English   中英

在 RDD PySpark 中導入 csv 文件

[英]import csv file in RDD PySpark

我們有一個名為 survey.csv 的 csv 文件,我們需要將它加載到一個 rdd 中。

我們試過這個:

rdd_test = survey_results.csv.map(lambda x: (x, 1)) 

它不起作用。 任何人都可以幫忙嗎?

SparkContext.textFile創建一個 RDD

導入系統

from pyspark import SparkContext
 
# create Spark context
sc = SparkContext()
 
# read input text file to RDD
lines = sc.textFile("./survey.csv")

來源

有用的帖子

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM