繁体   English   中英

如何根据条件替换 Panda 数据框列中的单元格

[英]How do I replace cells in a Panda dataframe column based on a condition

这篇文章包含两个问题,涉及我在尝试根据给定条件替换 Panda 数据框中的元素时遇到的问题。 我是 Pandas 的新手,所以任何建议都将是最有帮助的。

1:修改一定长度的字符串

考虑 Panda 数据框对象 df 中的 A 列:

SSIC
103
1040
1054
1065
107

我想将整数 0 附加到长度小于 4 的每个单元格。 也就是说,我想获得:

SSIC
0103
1040
1054
1065
0107

这些值属于 float64 类型。

目前,我使用了这种方法:

SSIC1 = df['SSIC'].astype('int64').astype(str)

for i,n in enumerate(SSIC1):
    if len(SSIC1[i]) == 4:
       SSIC1[i] = '0' + SSIC1[i]

df['SSIC'] = SSIC1

它有效,但我想知道它是否相当冗长。 有没有更直接的方法来解决这个问题?

2:使用 where 子句时设置复制警告

我在数据框中有以下两列

A  B
2  1
3  4
4  6
5  4
5  2

我想用 B 中同一行上的值替换 A 列中值为 5 的单元格。

我使用了 where 条件:

df['A']=df['A'].where(df['A'] == 5, df['B'], inplace=True)

但它给了我以下错误:

SettingWithCopyWarning:试图在 DataFrame 中切片的副本上设置值。 尝试使用 .loc[row_indexer,col_indexer] = value 代替

请参阅文档中的注意事项: http : //pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy if name == ' main ':

我第一次运行它时没有出现这个警告。 任何想法为什么它突然出现?

对于您的第一部分,请调用矢量化str.zfill

In [167]:
df['SSIC'].astype(str).str.zfill(4)

Out[167]:
0    0103
1    1040
2    1054
3    1065
4    0107
Name: SSIC, dtype: object

你可能不需要调用astype如果dtype已经是str

使用 dataframe.at[] 函数。 那是:

df.at[row_index,column_name] = '所需的分配'

例如:

df = pd.DataFrame(data=[['iqbal',2,88]],columns=['name','roll','marks'],index=[0])
df.at[0,'name']= 'Joy'

`

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM