繁体 English 中英

如何根据字段将数据从 CSV 加载到单独的 Hadoop HDFS 目录中

[英]How to Load data from CSV into separate Hadoop HDFS directories based on fields

原文 2021-11-03 20:31:00 4 1 java/ hadoop

我有一个 CSV 数据，我需要根据某个字段（年份）将其加载到 HDFS 目录中。 我打算使用Java。 我已经看过使用 BufferedReader 但是我在实现它时遇到了麻烦。 这是用于此任务的最佳方法还是有更好的方法？

1 个解决方案

使用 Spark 将 CSV 读入数据帧。

在写入 HDFS 期间使用partitionBy("year") ，它将在以year=开头的路径下为每个唯一值创建子文件夹。

在Hadoop中在哪里创建HDFS目录？

[英]Where are HDFS directories created in Hadoop?

如何挂载Hadoop HDFS

[英]How to mount Hadoop HDFS

将数据从mongoDB复制到hdfs时的hadoop jar错误

[英]hadoop jar error while copying data from mongoDB to hdfs

在hadoop中保存hdfs中的json数据

[英]saving json data in hdfs in hadoop

Hadoop如何获得未存储在HDFS上的输入数据？

[英]How does Hadoop get input data not stored on HDFS?

Hadoop 从 HDFS 读取 JSON

[英]Hadoop read JSON from HDFS

如何从Hadoop作业的Reducer中将数据加载到dynamodb表中

[英]How to load data into dynamodb table from the reducer of a hadoop job

如何从 Java 代码运行 Hadoop HDFS 命令

[英]How to run Hadoop HDFS command from java code

如何序列化hadoop中的对象（在HDFS中）

[英]How to Serialize object in hadoop (in HDFS)

如何有效地将数据从 CSV 加载到数据库中？

[英]How to efficiently load data from CSV into Database?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在Hadoop中在哪里创建HDFS目录？如何挂载Hadoop HDFS 将数据从mongoDB复制到hdfs时的hadoop jar错误在hadoop中保存hdfs中的json数据 Hadoop如何获得未存储在HDFS上的输入数据？ Hadoop 从 HDFS 读取 JSON 如何从Hadoop作业的Reducer中将数据加载到dynamodb表中如何从 Java 代码运行 Hadoop HDFS 命令如何序列化hadoop中的对象（在HDFS中）如何有效地将数据从 CSV 加载到数据库中？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM