繁体   English   中英

R/箭头:读取镶木地板数据文件时遇到问题

[英]R/arrow: trouble reading parquet data files

我正在尝试读入一个相对较大的镶木地板文件(~4M 行,~100 列)。 有人可以帮我解释以下错误消息吗?

在将 csv 格式的文件转换为镶木地板文件后,我可以毫无困难地读取/写入文件,我试图使用arrow::read_parquet读取它,但收效甚微。 当我尝试读入它时,我收到以下错误。

library(tidyverse)
library(arrow)
par <- file.path(dir, 'path', 'to', 'my', 'file.parquet') %>% 
           read_parquet
glimpse(par)

# Error in setalloccol(newx) : 
#  Internal error: length of names (0) is not length of dt (109)

我得到

names(par)
#NULL

说到这里,我可以观察到 csv 版本和 parquet 版本的行数和列数相同

我收到的另一个常见错误是:

Error in `[[<-.data.frame`(`*tmp*`, "..row.names..", value = 1:3279887) : 
   replacement has 3279887 rows, data has 0 

这个问题是特定于箭头版本的,并且已经被修补。 以前使用的是 1.0.0 版本,但无法在 4.0.1 上复制错误

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM