[英]Dropping a problematic column from a dask dataframe
我有一个带有问题列的dask
数据dask
,(我相信)是每次尝试对数据to_csv
执行任何操作(无论是head
还是to_csv
,甚至当我尝试使用(不同的)列。该错误很可能是由于数据类型不匹配造成的,并显示如下:
ValueError: invalid literal for int() with base 10: 'FIPS'
因此,我决定使用删除该列( 'FIPS'
)
df = df.drop('FIPS', axis=1)
现在,当我执行df.columns
,我不再看到'FIPS'
,这意味着它确实已被删除。 但是当我尝试将另一个列写入文件时
df.column_a.to_csv('example.csv')
我不断收到相同的错误
ValueError: invalid literal for int() with base 10: 'FIPS'
我认为这与dask
的惰性方法有关,从而延迟了下降,但是任何变通方法都将非常有帮助。
基本上,我只需要从df
提取单个列( column_a
)。
删除后尝试转换为熊猫数据框
df.compute()
然后写到csv
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.