繁体 English 中英

在 Java spark 中，如何基于索引 select 列

[英]In Java spark, how to select columns based on index

原文 2022-08-19 08:12:09 9 1 java/ apache-spark/ apache-spark-dataset

我如何才能在 java spark 中的 csv 文件（文件中没有列名）中仅 select 第 2 列和第 5 列，代码如下：

Dataset<Row> dataset = getSparkSession().get().read()
                .option("delimiter", "|")
                .option("header", false)
                .csv(fileName);

1 个解决方案

您将通过以下命令获取架构：

dataset.printSchema();

之后 select 你想要的列

dataset.select("c1",c4");

如何在 Spark Java 中使用数据框构建基于其他列的列？

[英]How to construct a column based on other columns using dataframe in Spark Java?

从 DataFrame (Java/Spark) 中选择指定的列

[英]Select specified columns from DataFrame (Java/Spark)

如何使用 java Spark 编码从 CSV 文件中选择 3 列也分组并最终求和

[英]How to select 3 columns from CSV file using java Spark coding also group by and finally sum

在Spark的Java API中，如何从数据集中选择列 <Row> 使用正则表达式？

[英]In Spark's Java API, how can I select columns from a Dataset<Row> using regular expressions?

如何在 Spark RDD (Java) 中按索引获取元素

[英]How to get element by Index in Spark RDD (Java)

Spark DataFrame-使用Java API选择列列表

[英]Spark DataFrame - select list of columns using Java API

Java Spark - 根据列数过滤 RDD 中的记录时出现问题

[英]Java Spark - Issue in filtering records in RDD based on number of columns

如何对Java中的列组合对火花数据框进行排序？

[英]How to sort spark dataframe on the combination of columns in Java?

如何在 Java Spark 中将列转换为行

[英]How to transpose columns into rows in Java Spark

如何在 Spark Java 中将数组分解为多列

[英]How to explode an array into multiple columns in Spark Java

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在 Spark Java 中使用数据框构建基于其他列的列？从 DataFrame (Java/Spark) 中选择指定的列如何使用 java Spark 编码从 CSV 文件中选择 3 列也分组并最终求和在Spark的Java API中，如何从数据集中选择列 <Row> 使用正则表达式？如何在 Spark RDD (Java) 中按索引获取元素 Spark DataFrame-使用Java API选择列列表 Java Spark - 根据列数过滤 RDD 中的记录时出现问题如何对Java中的列组合对火花数据框进行排序？如何在 Java Spark 中将列转换为行如何在 Spark Java 中将数组分解为多列

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM