繁体   English   中英

从dask数据框中删除有问题的列

[英]Dropping a problematic column from a dask dataframe

我有一个带有问题列的dask数据dask ,(我相信)是每次尝试对数据to_csv执行任何操作(无论是head还是to_csv ,甚至当我尝试使用(不同的)列。该错误很可能是由于数据类型不匹配造成的,并显示如下:

ValueError: invalid literal for int() with base 10: 'FIPS'

因此,我决定使用删除该列( 'FIPS'

df = df.drop('FIPS', axis=1)

现在,当我执行df.columns ,我不再看到'FIPS' ,这意味着它确实已被删除。 但是当我尝试将另一个列写入文件时

df.column_a.to_csv('example.csv')

我不断收到相同的错误

ValueError: invalid literal for int() with base 10: 'FIPS'

我认为这与dask的惰性方法有关,从而延迟了下降,但是任何变通方法都将非常有帮助。

基本上,我只需要从df提取单个列( column_a )。

删除后尝试转换为熊猫数据框

df.compute()

然后写到csv

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM