[英]Error: Invalid: Unrecognized filesystem type in URI when loading parquet file from url using arrow package
我對 parquet 文件格式非常陌生,我正在使用read_parquet()
(在arrow
包中)將 parquet 文件(存儲在我的 Dropbox 共享文件夾中)加載到 R 中。 但是,我收到以下錯誤消息
library(arrow) df <- read_parquet("https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1") Error: Invalid: Unrecognized filesystem type in URI: https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1
什么可能導致此問題,我是否需要事先對 url 鏈接進行分區?
arrow
package 中的文件讀取功能尚不支持HTTP[S]
URI。 我們希望在未來的版本中添加此功能 ( ARROW-7594 )。 同時:
如果您在運行它的計算機上安裝了 Dropbox,請使用文件的本地路徑而不是HTTPS
URI。
如果您沒有安裝 Dropbox,請先下載文件,如下所示:
myfile <- tempfile()
download.file(
"https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1",
myfile,
mode = "wb"
)
df <- read_parquet(myfile)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.