簡體 English 中英

如何根據字段將數據從 CSV 加載到單獨的 Hadoop HDFS 目錄中

[英]How to Load data from CSV into separate Hadoop HDFS directories based on fields

原文 2021-11-03 20:31:00 6 1 java/ hadoop

我有一個 CSV 數據，我需要根據某個字段（年份）將其加載到 HDFS 目錄中。 我打算使用Java。 我已經看過使用 BufferedReader 但是我在實現它時遇到了麻煩。 這是用於此任務的最佳方法還是有更好的方法？

1 個解決方案

使用 Spark 將 CSV 讀入數據幀。

在寫入 HDFS 期間使用partitionBy("year") ，它將在以year=開頭的路徑下為每個唯一值創建子文件夾。

在Hadoop中在哪里創建HDFS目錄？

[英]Where are HDFS directories created in Hadoop?

如何掛載Hadoop HDFS

[英]How to mount Hadoop HDFS

將數據從mongoDB復制到hdfs時的hadoop jar錯誤

[英]hadoop jar error while copying data from mongoDB to hdfs

在hadoop中保存hdfs中的json數據

[英]saving json data in hdfs in hadoop

Hadoop如何獲得未存儲在HDFS上的輸入數據？

[英]How does Hadoop get input data not stored on HDFS?

Hadoop 從 HDFS 讀取 JSON

[英]Hadoop read JSON from HDFS

如何從Hadoop作業的Reducer中將數據加載到dynamodb表中

[英]How to load data into dynamodb table from the reducer of a hadoop job

如何從 Java 代碼運行 Hadoop HDFS 命令

[英]How to run Hadoop HDFS command from java code

如何序列化hadoop中的對象（在HDFS中）

[英]How to Serialize object in hadoop (in HDFS)

如何有效地將數據從 CSV 加載到數據庫中？

[英]How to efficiently load data from CSV into Database?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 在Hadoop中在哪里創建HDFS目錄？如何掛載Hadoop HDFS 將數據從mongoDB復制到hdfs時的hadoop jar錯誤在hadoop中保存hdfs中的json數據 Hadoop如何獲得未存儲在HDFS上的輸入數據？ Hadoop 從 HDFS 讀取 JSON 如何從Hadoop作業的Reducer中將數據加載到dynamodb表中如何從 Java 代碼運行 Hadoop HDFS 命令如何序列化hadoop中的對象（在HDFS中）如何有效地將數據從 CSV 加載到數據庫中？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM