繁体   English   中英

如何在调试模式下运行配置单元

[英]how to run hive in debug mode

我从cloudera网站上拿了一个例子来编写一个用于解析文件的自定义SerDe

http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/

这似乎是一个很好的例子,但当我用自定义serde创建表

ADD JAR <path-to-hive-serdes-jar>;

CREATE EXTERNAL TABLE tweets (
  id BIGINT,
  created_at STRING,
  source STRING,
  favorited BOOLEAN,
  retweeted_status STRUCT<
    text:STRING,
    user:STRUCT<screen_name:STRING,name:STRING>,
    retweet_count:INT>,
  entities STRUCT<
    urls:ARRAY<STRUCT<expanded_url:STRING>>,
    user_mentions:ARRAY<STRUCT<screen_name:STRING,name:STRING>>,
    hashtags:ARRAY<STRUCT<text:STRING>>>,
  text STRING,
  user STRUCT<
    screen_name:STRING,
    name:STRING,
    friends_count:INT,
    followers_count:INT,
    statuses_count:INT,
    verified:BOOLEAN,
    utc_offset:INT,
    time_zone:STRING>,
  in_reply_to_screen_name STRING
) 
PARTITIONED BY (datehour INT)
ROW FORMAT SERDE 'com.cloudera.hive.serde.JSONSerDe'
LOCATION '/user/flume/tweets';

它执行得很好,但是当我这样做

select * from tweets;

我什么都没得到,所以我想知道我是否可以在调试模式下运行配置单元以查看它失败的原因

你最好通过将logger模式切换到DEBUG来启动hive shell,如下所示,我希望你能从那里找到有用的东西。

hive --hiveconf hive.root.logger=DEBUG,console

设置hive --hiveconf hive.root.logger=DEBUG,console由于公司特定的设置hive --hiveconf hive.root.logger=DEBUG,console 可能无法始终工作

我最终在我的主目录中创建了一个hive-log4j.properties文件,其中包含以下设置:

log4j.rootCategory=DEBUG,console
log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.err
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n

并使用CLASSPATH=$HOME hive启动hive shell, hive-log4j.properties在类路径前添加了hive-log4j.properties的主目录,因此被选中。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM