簡體   English   中英

從hdfs到hive的Csv文件攝取

[英]Csv file ingestion from hdfs to hive

我試圖使用下面的命令從我的hdfs攝取csv文件到hive。

create table test (col1 string, col2 int, col3 string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES ("separatorChar" = ",","quoteChar" = "\"")
stored as textfile;

但我仍然在我的hive表中得到雙引號,所以我嘗試了下面的命令。

alter table test
set TBLPROPERTIES ('skip.header.line.count'='1','serialization.null.format' = '');

但仍然得到雙引號。 我該怎么做才能刪除這些雙引號?

您需要指定文件位置。
例如:
CREATE TABLE test (col1 string, col2 int, col3 string) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES ("separatorChar" = ",") STORED AS textfile LOCATION 'hdfs://<your-data-node-address>:8020/hdfs/path/to/csv/files-dir';
當我以這種方式創建表時,我的表中的值沒有引號(源csv文件確實有)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM