簡體   English   中英

用另一個值替換熊貓數據框列中的幾個值

[英]Replacing few values in a pandas dataframe column with another value

我有一個熊貓數據框 df 如下圖所示:

BrandName Specialty
A          H
B          I
ABC        J
D          K
AB         L

我想用 A 替換 BrandName 列中的“ABC”和“AB”。有人可以幫忙嗎?

最簡單的方法是在列上使用replace方法。 參數是您要替換的內容的列表(此處為['ABC', 'AB'] )以及要替換的內容(在本例中為字符串'A' ):

>>> df['BrandName'].replace(['ABC', 'AB'], 'A')
0    A
1    B
2    A
3    D
4    A

這將創建一個新的系列值,因此您需要將此新列分配給正確的列名:

df['BrandName'] = df['BrandName'].replace(['ABC', 'AB'], 'A')

代替

DataFrame對象具有強大而靈活的replace方法:

DataFrame.replace(
        to_replace=None,
        value=None,
        inplace=False,
        limit=None,
        regex=False, 
        method='pad',
        axis=None)

請注意,如果您需要inplace進行更改,請使用inplace布爾參數replace方法:

到位

就地:布爾值,默認為False如果True ,就地。 注意:這將修改此對象上的任何其他視圖(例如,DataFrame 中的列)。 如果這是True則返回調用者。

片段

df['BrandName'].replace(
    to_replace=['ABC', 'AB'],
    value='A',
    inplace=True
)

loc方法可用於替換多個值:

df.loc[df['BrandName'].isin(['ABC', 'AB'])] = 'A'

您還可以將dict傳遞給pandas.replace方法:

data.replace({
    'column_name': {
        'value_to_replace': 'replace_value_with_this'
    }
})

這樣做的好處是您可以一次替換多列中的多個值,如下所示:

data.replace({
    'column_name': {
        'value_to_replace': 'replace_value_with_this',
        'foo': 'bar',
        'spam': 'eggs'
    },
    'other_column_name': {
        'other_value_to_replace': 'other_replace_value_with_this'
    },
    ...
})

此解決方案將更改現有數據幀本身:

mydf = pd.DataFrame({"BrandName":["A", "B", "ABC", "D", "AB"], "Speciality":["H", "I", "J", "K", "L"]})
mydf["BrandName"].replace(["ABC", "AB"], "A", inplace=True)

創建數據框:

import pandas as pd
dk=pd.DataFrame({"BrandName":['A','B','ABC','D','AB'],"Specialty":['H','I','J','K','L']})

現在使用DataFrame.replace()函數:

dk.BrandName.replace(to_replace=['ABC','AB'],value='A')

只是想表明兩種主要方法之間沒有性能差異:

df = pd.DataFrame(np.random.randint(0,10,size=(100, 4)), columns=list('ABCD'))

def loc():
    df1.loc[df1["A"] == 2] = 5
%timeit loc
19.9 ns ± 0.0873 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


def replace():
    df2['A'].replace(
        to_replace=2,
        value=5,
        inplace=True
    )
%timeit replace
19.6 ns ± 0.509 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

您可以使用 loc 根據條件進行替換並指定列名

df = pd.DataFrame([['A','H'],['B','I'],['ABC','ABC'],['D','K'],['AB','L']],columns=['BrandName','Col2'])
df.loc[df['BrandName'].isin(['ABC', 'AB']),'BrandName'] = 'A'

輸出
在此處輸入圖片說明

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM