[英]dask.dataframe.tail() returns empty dataframe
我试图在 dask dataframe 的最后一行中获取“n”的值。
如果我理解正确,位置索引不是一种选择。 我不知道最后一行的索引。 我认为 tail() 将是解决方案,但它返回并清空 dataframe。
print( df.compute() ) # df has 47 rows
返回
file str n
11027 /Users/... XXX... 901
11028 /Users/... XXX... 902
...
11099 /Users/... XXX... 946
11100 /Users/... XXX... 947
然后我做
tail = df.tail( n=10, compute=True )
print(tail)
这需要一分十五秒,这慢得让人无法接受,因为我需要做几千次这样的事情并返回
Empty DataFrame
Columns: [file, str, n]
Index: []
我在这里想念什么?
请注意,我找到了 head() 返回空的解决方案,但该解决方案不适用于 tail()。 dask dataframe head() 返回空 df
用print (df.tail(10))
访问https://tutorial.dask.org/04_dataframe.html并找到标题为“刚刚发生了什么? ”的章节 . 它包含说明 go 会出现什么错误以及原因。
它还包含一个使用read_csv读取 DataFrame 的配方,您还应该传递dtype参数,指定列类型。
试试这个方法。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.