繁体   English   中英

Cassandra批量加载dsbulk-时间戳格式问题

[英]Cassandra bulk load dsbulk - Timestamp format issue

我正在尝试使用dsbulk实用程序将csv文件加载到cassandra中。 我收到时间戳格式问题。

Source  : dance,204b0700-7214-3809-9da1-fe5499113b20,1953-08-26 10:00:00+0000,Roman Holiday,,,\u000a
java.lang.IllegalArgumentException: Could not parse '1953-08-26 10:00:00+0000'; accepted formats are: temporal string (e.g. '2018-09-20T07:52:19.921Z') or numeric value (milliseconds since 1970-01-01T00:00:00Z)

Suppressed: java.text.ParseException: Invalid number format: 1953-08-26 10:00:00+0000
Suppressed: java.time.format.DateTimeParseException: Text '1953-08-26 10:00:00+0000' could not be parsed: Invalid value for MonthOfYear (valid values 1 - 12): 0
Caused by: java.time.DateTimeException: Invalid value for MonthOfYear (valid values 1 - 12): 0

输入文件具有以下格式:

cat videos_by_tag.csv.mini2
customs house,d4acc6b9-f9b8-708e-5f7e-9df19a24bf5a,2001-07-12 10:00:00+0000,The Score,,,
dance,204b0700-7214-3809-9da1-fe5499113b20,1953-08-26 10:00:00+0000,Roman Holiday,,,
dance,262ebef4-0626-4758-d0cd-4b72ad1526a7,2000-09-21 10:00:00+0000,Dancer in the Dark ,,,
dance,3eea5ebb-6be2-9bdc-68e2-cabf89070855,2015-02-16 08:00:00+0000,Blue,,,
family estate,5b2eb210-b092-3f9c-de29-ea388b5964ae,1993-10-18 10:00:00+0000,The House of the Spirits ,,,

我尝试覆盖时间戳格式选项。 没有帮助。

codec.timestamp = "yyyy-mm-dd HH:MM:SS+NNNN"

版本

  • DSE版本:6.0.0
  • DataStax批量加载:v1.0.1
  • 卡桑德拉:4.0.0.2284

表结构:

CREATE TABLE killrvideo.videos_by_tag ( tag text, videoid uuid, added_date timestamp, name text, preview_image_location text, tagged_date timestamp, userid uuid, PRIMARY KEY (tag, videoid) ) WITH CLUSTERING ORDER BY (videoid ASC)

请指教。

您是否尝试过使用dsbulk 1.2.0? 使用1.2.0导入成功。

当使用1.0.1时,我得到了相同的错误。

我对文档进行了一些研究,似乎只支持一些时间戳模式。

因此,有两种可能的解决方案:

  • 使用dsbulk 1.2.0版本
  • 重新格式化您的csv文件并更改时间戳格式; 例如,您应该有1953-08-26T10:00:00 + 00,而不是1953-08-26 10:00:00 + 0000。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM