[英]Dask error: Length of values does not match length of index
我已经用dask这样读取了csv文件:
import dask.dataframe as dd
train = dd.read_csv('act_train.csv')
然后我想对每行应用简单的逻辑,这在熊猫中可以很好地工作:
columns = list(train.columns)
for col in columns[1:]:
train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1])
不幸的是,代码的最后一行生成以下错误: 值的长度与索引的长度不匹配
我究竟做错了什么?
如果x不包含空格字符,则x.split('')将返回包含单个元素x的列表。
因此,当您尝试通过调用x.split('')[1]访问x.split('')的第二个元素时。 它将给出错误:
“值的长度与索引的长度不匹配”,因为x.split('')的索引1处没有元素。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.