[英]How to remove elements of csv file using rdd in scala?
如何在Scala中使用RDD刪除CSV文件的元素?
val textRDD = sc.textFile("file:/home/bharathi/bhaskar/sample.tab")
我在sample.tab
這樣的值
A B C D
1 2 3 4
5 6 7 8
9 10 11 12
我必須刪除第二行並顯示輸出
假設第二行是5 6 7 8
,並且行之間沒有任何空行。 您可以使用zipWithIndex
將索引分配給每一行,然后根據索引過濾出不需要的行。
textRDD.zipWithIndex.filter(_._2 != 2).map(_._1).foreach(println)
它將打印
A B C D
1 2 3 4
9 10 11 12
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.