![](/img/trans.png)
[英]How to construct a column based on other columns using dataframe in Spark Java?
[英]In Java spark, how to select columns based on index
我如何才能在 java spark 中的 csv 文件(文件中没有列名)中仅 select 第 2 列和第 5 列,代码如下:
Dataset<Row> dataset = getSparkSession().get().read()
.option("delimiter", "|")
.option("header", false)
.csv(fileName);
您将通过以下命令获取架构:
dataset.printSchema();
之后 select 你想要的列
dataset.select("c1",c4");
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.