根据条件更改具有混合类型的 dataframe 列中的值

Question

我的数据集的一列既有字符串又有浮点数。 在该列中，对于每个字符串，我仅尝试将其替换为字符串的前 5 个字符。

def isfloat(num):
    try:
        float(num)
        return True
    except ValueError:
        return False

df = pd.DataFrame([[1, "Alligator"], [1, 3], [4, "Markets"]], columns=['A', 'B'])

以下两种方法似乎并没有改变实际的dataframe。

df['B'].apply(lambda x: float(x) if isfloat(x) else x[0:5])

for index, row in df.iterrows():
    if not isfloat(row.B):
        row.B = row.B[0:5]

下一个方法导致警告“无法将系列转换为 <class 'float'>”，我认为是因为无法以这种方式调用 isfloat 方法。

df['B'] = np.where(not isfloat(df['B']), df['B'][0:5], df['B'])

我也尝试过 using.loc ，但它似乎不合适，因为我需要根据条件进行更改。 一个 go 怎么会这样，或者我错过了什么？

Answer 1

我相信你需要：

df['B']=df['B'].apply(lambda x: float(x) if isfloat(x) else x[0:5])

由于 DataFrame 没有就地编辑。

Output：

   A      B
0  1  Allig
1  1    3.0
2  4  Marke

Answer 2

嗨，首先数据框没有就地编辑。 您只需将 df.B 列的编辑值再次存储在 df.B 列中。

df.B=df.B.apply(lambda x: float(x) if isfloat(x) else x[0:5])

您也可以使用以下代码：

import pandas as pd
df = pd.DataFrame([[1, "Alligator"], [1, 3], [4, "Markets"]], columns=['A', 'B'])
newlist=[]   
for v in df.B:
    if type(v)==str:
        newlist.append(v[:5])
    else:
        newlist.append(v)
df['B']=newlist

根据条件更改具有混合类型的 dataframe 列中的值

问题描述

2 个解决方案

解决方案1
2 已采纳 2022-01-25 23:18:05

解决方案2
0 2022-01-25 23:36:36

根据条件更改具有混合类型的 dataframe 列中的值

问题描述

2 个解决方案

解决方案1 2 已采纳 2022-01-25 23:18:05

解决方案2 0 2022-01-25 23:36:36

解决方案1
2 已采纳 2022-01-25 23:18:05

解决方案2
0 2022-01-25 23:36:36