繁体   English   中英

Pandas DataFrame:SettingWithCopyWarning:尝试在DataFrame的切片副本上设置值

[英]Pandas DataFrame: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame

我知道有很多关于这个警告的帖子,但我无法找到解决方案。 这是我的代码:

df.loc[:, 'my_col'] = df.loc[:, 'my_col'].astype(int)
#df.loc[:, 'my_col'] = df.loc[:, 'my_col'].astype(int).copy()
#df.loc[:, 'my_col'] = df['my_col'].astype(int)

它产生警告:

SettingWithCopyWarning:尝试在DataFrame的切片副本上设置值。 尝试使用.loc [row_indexer,col_indexer] = value

即使我按照建议更改了代码,我仍然会收到此警告? 我需要做的就是转换一列的数据类型。

**备注:**最初该列的类型为float,具有一位小数(例如:4711.0)。 因此我将其更改为整数(4711)然后更改为字符串('4711') - 只是为了删除小数。

感谢您的帮助!

更新:该警告对过滤之前完成的原始数据的过滤产生了副作用。 我错过了DataFrame.copy()。 使用副本代替,解决了问题!

df = df[df['my_col'].notnull()].copy()
df.loc[:, 'my_col'] = df['my_col'].astype(int).astype(str)
#df['my_col'] = df['my_col'].astype(int).astype(str) # works too!

我认为需要copy并省略选择列的loc

df = df[df['my_col'].notnull()].copy()
df['my_col'] = df['my_col'].astype(int).astype(str)

说明

如果稍后修改df值,您会发现修改不会传播回原始数据( df ),并且Pandas会发出警告。

另一种方法是禁用链式赋值,它可以在您的代码上运行, 而无需创建副本

# disable chained assignments
pd.options.mode.chained_assignment = None 

如果需要更改单个列的数据类型,则可以更直接地处理该列:

df['my_col'] = df['my_col'].astype(int)

或者使用.assign

df = df.assign(my_col=lambda d: d['my_col'].astype(int))

如果您只需要转换一次,并且不希望在该范围之外更改您的df ,则.assign非常有用。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM