簡體   English   中英

如何使用Dimporttsv從hdfs加載csv文件到hbase表

[英]How to load csv file from hdfs to hbase table using Dimporttsv

我正在嘗試使用shell命令Dimporttsv.將csv文件加載到hbase表中Dimporttsv. csv文件駐留在我的hdfs(/ csvFiles)中的目錄中

csv文件是從mysql表生成的,包含以下字段:

+-------------+
Field       
+-------------+
tweet_id
user_id
screen_name
description
created_at
+-------------+

我在hbase中創建了一個具有單個姓氏的表,如下所示:

create 'dummyTable', 'cf1'

我正在使用的命令:

ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns=HBASE_ROW_KEY,cf1:user_id,cf1:tweet_id,cf1:screen_name,cf1:description,cf1:created_at dummyTable /csvFiles/all_users.csv

但是我收到此語法錯誤:

SyntaxError: (hbase):8: syntax error, unexpected tSYMBEG

我查看了以下帖子,並按照其中的建議,但無濟於事。 我很感激你的幫助。

將TSV文件導入hbase表

https://community.hortonworks.com/articles/4942/import-csv-data-into-hbase-using-importtsv.html

http://hbase.apache.org/book.html#importtsv

退出Hbase shell並嘗試向importtsv.columns添加單引號

bash$ hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,cf1:user_id,cf1:tweet_id,cf1:screen_name,cf1:description,cf1:created_at' dummyTable hdfs://<your_name_node_addr>/csvFiles/all_users.csv

(要么)

From Hbase Shell:

hbase(main):001:0> ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,cf1:user_id,cf1:tweet_id,cf1:screen_name,cf1:description,cf1:created_at' dummyTable hdfs://<your_name_node_addr>/csvFiles/all_users.csv

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM