繁体   English   中英

spark parquet - 如何加载 LZO 压缩的镶木地板文件

[英]spark parquet - How to load LZO compressed parquet file

我在本地保存了镶木地板文件,通过以下方式加载:

val catDF = sqlContext.read.parquet("data.lzo.parquet") 

它识别架构,但每个查询或操作返回相同的以下错误:

parquet.io.ParquetDecodingException:无法读取块 -1 中 0 处的值

将镶木地板文件作为数据框加载就像您所说的一样简单

val catDF = sqlContext.read.parquet("data.parquet") 

你上面的代码应该可以工作。 请检查拼花位置是否正确

LZO(实木复合地板)压缩问题,解决了向 sbt 配置添加依赖项的问题:

libraryDependencies ++= Seq("org.anarres.lzo" % "lzo-hadoop" % "1.0.0")

希望对某人有用。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM