簡體   English   中英

在熊貓中使用正則表達式修改特定字符之前的列數據

[英]Modify column data before a specific character using Regex in pandas

我試圖通過刪除逗號前的所有字符來修改地址列數據。

樣本數據:

                       **ADDRESS**
0                    Ksfc Layout,Bangalore
1                Vishweshwara Nagar,Mysore
2                         Jigani,Bangalore
3              Sector-1 Vaishali,Ghaziabad
4                         New Town,Kolkata

預期輸出:

                      **ADDRESS**
0                        Bangalore
1                        Mysore
2                        Bangalore
3                        Ghaziabad
4                        Kolkata

我試過這段代碼,但它不起作用有人可以更正代碼嗎?

import pandas as pd
import regex as re

data = pd.read_csv("train.csv")

data.ADDRESS.replace(re.sub(r'.*,',"", data.ADDRESS), regex=True, inplace=True)

嘗試這個:

data.ADDRESS = data.ADDRESS.str.split(',').str[-1]

您可以在沒有正則表達式的情況下執行此操作:

def removeFirst(x):
    return x.split(",")[-1]

df['ADDRESS'] = df['ADDRESS'].apply(removeFirst)

你可以在沒有正則表達式的情況下嘗試這樣:

data['ADDRESS'] = data['ADDRESS'].str.split(',').str[-1]

使用Series.str.replace

data['ADDRESS'] = data['ADDRESS'].str.replace(r'.*,', '')

查看證明

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM