繁体   English   中英

熊猫错误地将字符串转换为浮点数

[英]Pandas falsely converting strings to floats

我正在使用Excel中的csv文件创建熊猫数据框。 最近,我遇到了一些有关数据帧中每一列的dtypes的ValueError消息。

这是最近引发的异常:

ValueError:无法将字符串转换为float:'OH'

在我的数据帧上运行pandas的dtypes方法后,它表明该特定列addr_state是一个对象,而不是浮点数。

为了清楚起见,我在下面粘贴了所有代码:

work_path = 'C:\\Users\\Projects\\loans.csv'
unfiltered_y_df = pd.read_csv(work_path, low_memory=False, encoding='latin-1')
print(unfiltered_y_df.dtypes)
filtered_y_df = unfiltered_y_df.loc[unfiltered_y_df['loan_status'].isin(['Fully Paid', 'Charged Off', 'Default'])]

X = StandardScaler().fit_transform(filtered_y_df[[column for column in filtered_y_df]])
Y = filtered_y_df['loan_status']

另外,是否可以为每列明确写出dtypes? 现在,我觉得这是解决此问题的唯一方法。 提前致谢!

我认为这里有两个问题:

  1. 要输出每列的类型,只需使用ftypes或dtypes方法:

    即unfiltered_y_df.ftypes

  2. 您说“ addr_state”是一个对象而不是float。 嗯,这就是问题所在,StandardScaler()仅适用于浮点数,因此它正试图将您的状态“ OH”强制为浮点数,并且不能,因此错误

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM