繁体   English   中英

dask.dataframe.tail() 返回空 dataframe

[英]dask.dataframe.tail() returns empty dataframe

我试图在 dask dataframe 的最后一行中获取“n”的值。

如果我理解正确,位置索引不是一种选择。 我不知道最后一行的索引。 我认为 tail() 将是解决方案,但它返回并清空 dataframe。

print( df.compute() ) # df has 47 rows

返回

       file            str          n 
11027  /Users/...      XXX...       901  
11028  /Users/...      XXX...       902  
...                                   
11099  /Users/...      XXX...       946
11100  /Users/...      XXX...       947

然后我做

tail = df.tail( n=10, compute=True )
print(tail)

这需要一分十五秒,这慢得让人无法接受,因为我需要做几千次这样的事情并返回

Empty DataFrame
Columns: [file, str, n]
Index: []

我在这里想念什么?

请注意,我找到了 head() 返回空的解决方案,但该解决方案不适用于 tail()。 dask dataframe head() 返回空 df

print (df.tail(10))

访问https://tutorial.dask.org/04_dataframe.html并找到标题为“刚刚发生了什么? ”的章节 . 它包含说明 go 会出现什么错误以及原因。

它还包含一个使用read_csv读取 DataFrame 的配方,您还应该传递dtype参数,指定列类型。

试试这个方法。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM