在熊貓中使用正則表達式修改特定字符之前的列數據

Question

我試圖通過刪除逗號前的所有字符來修改地址列數據。

樣本數據：

                       **ADDRESS**
0                    Ksfc Layout,Bangalore
1                Vishweshwara Nagar,Mysore
2                         Jigani,Bangalore
3              Sector-1 Vaishali,Ghaziabad
4                         New Town,Kolkata

預期輸出：

                      **ADDRESS**
0                        Bangalore
1                        Mysore
2                        Bangalore
3                        Ghaziabad
4                        Kolkata

我試過這段代碼，但它不起作用有人可以更正代碼嗎？

import pandas as pd
import regex as re

data = pd.read_csv("train.csv")

data.ADDRESS.replace(re.sub(r'.*,',"", data.ADDRESS), regex=True, inplace=True)

Answer 1

嘗試這個：

data.ADDRESS = data.ADDRESS.str.split(',').str[-1]

Answer 2

您可以在沒有正則表達式的情況下執行此操作：

def removeFirst(x):
    return x.split(",")[-1]

df['ADDRESS'] = df['ADDRESS'].apply(removeFirst)

Answer 3

你可以在沒有正則表達式的情況下嘗試這樣：

data['ADDRESS'] = data['ADDRESS'].str.split(',').str[-1]

Answer 4

使用Series.str.replace ：

data['ADDRESS'] = data['ADDRESS'].str.replace(r'.*,', '')

查看證明

在熊貓中使用正則表達式修改特定字符之前的列數據

問題描述

4 個解決方案

解決方案1
0 2020-10-07 16:04:52

解決方案2
0 2020-10-07 16:05:46

解決方案3
0 2020-10-07 16:05:52

解決方案4
0 2020-10-07 21:37:17

在熊貓中使用正則表達式修改特定字符之前的列數據

問題描述

4 個解決方案

解決方案1 0 2020-10-07 16:04:52

解決方案2 0 2020-10-07 16:05:46

解決方案3 0 2020-10-07 16:05:52

解決方案4 0 2020-10-07 21:37:17

解決方案1
0 2020-10-07 16:04:52

解決方案2
0 2020-10-07 16:05:46

解決方案3
0 2020-10-07 16:05:52

解決方案4
0 2020-10-07 21:37:17