簡體   English   中英

如何在scala中使用rdd刪除csv文件的元素?

[英]How to remove elements of csv file using rdd in scala?

如何在Scala中使用RDD刪除CSV文件的元素?

val textRDD = sc.textFile("file:/home/bharathi/bhaskar/sample.tab")

我在sample.tab這樣的值

A   B   C   D
1   2   3   4
5   6   7   8
9   10  11  12

我必須刪除第二行並顯示輸出

假設第二行是5 6 7 8 ,並且行之間沒有任何空行。 您可以使用zipWithIndex將索引分配給每一行,然后根據索引過濾出不需要的行。

textRDD.zipWithIndex.filter(_._2 != 2).map(_._1).foreach(println)

它將打印

A B C D
1 2 3 4
9 10 11 12

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM