繁体   English   中英

NodeJS (JavaScript/TypeScript) - 读取 Parquet 文件时出错

[英]NodeJS (JavaScript/TypeScript) - Error while reading Parquet file

我正在尝试使用 nodejs 读取镶木地板文件:

var parquet = require('parquetjs');

(
    async () => {
    try {
            // create new ParquetReader that reads from 'fruits.parquet`
      let reader = await parquet.ParquetReader.openFile('f1.snappy.parquet');

        // create a new cursor
        let cursor = reader.getCursor();

        // read all records from the file and print them
        let record = null;
        while (record = await cursor.next()) {
            console.log(record);
        }

      } catch (e) {
        console.log('error while reading a parquet file:\n', e)
      }

    }

) ();

获取错误:

error while reading a parquet file:
 invalid page type: DICTIONARY_PAGE

相同的镶木地板文件 - 我可以使用 Python pyarrow 库毫无问题地阅读..

原因是什么?

我在使用 parquetjs 时遇到了同样的问题(在阅读嵌套对象时还有其他一些问题)

我切换到https://www.npmjs.com/package/parquetjs-lite现在一切正常

parquetjs-lite 是 parquetjs 的一个分支,所以我不需要更改任何代码

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM