使用 Python 刪除 dataframe 中的所有特定字符之后

Question

有一個特定字符的列表，我們需要刪除它后面的所有字符。

輸入數據：

  text_dir
abc School, Uk
xyz College, USA
Pqr University, Berlin

Output 需要的值：

  text_dir
abc School
xyz College
Pqr University

代碼片段：

spl_character=['School', 'college', 'university']
df['text_dir'] = df['text_dir'].str.split(spl_character).str[0]

Gives Error:
TypeError: unhashable type: 'list'

Answer 1

國際大學聯盟：

pat = f'(?i)^(.*)({"|".join(spl_character)}).*$'
df.text_dir.str.replace(pat, r'\1\2', regex=True)

0        abc School
1       xyz College
2    Pqr University
Name: text_dir, dtype: object

Answer 2

我修改了你的輸入並嘗試解決這個問題，我使用了正則表達式來解決這個問題。

import pandas as pd
import re


text_dir = ["abc School, Uk", "xyz College, USA", "Pqr University, Berlin"]
spl_character=['School,', 'College,', 'University,']


df = pd.DataFrame()
df['text_dir'] = text_dir


final_list = []

for item in df.text_dir:
    for character in spl_character:
        if j in i.split(' '):
            val_re = re.compile("^(.*)"+character+"")
            val_match = val_re.search(item)
            final_list.append(val_match.group())

df['text_dir'] = final_list

Output：

    text_dir
0   abc School,
1   xyz College,
2   Pqr University,

Answer 3

import pandas as pd

text_dir = ["abc School, Uk", "xyz College, USA", "Pqr University, Berlin"]
df = pd.DataFrame()
df['text_dir'] = text_dir

      text_dir
0   abc School, Uk
1   xyz College, USA
2   Pqr University, Berlin

使用 lambda function

# Reformat values for column "text_dir" using a lambda function
df['text_dir'] = df['text_dir'].apply(lambda x: x.split(',')[0])

Output

    text_dir
0   abc School
1   xyz College
2   Pqr University

使用 Python 刪除 dataframe 中的所有特定字符之后

問題描述

3 個解決方案

解決方案1
2 已采納 2021-03-25 05:47:13

解決方案2
0 2021-03-25 05:42:58

解決方案3
0 2021-03-25 05:52:54

使用 Python 刪除 dataframe 中的所有特定字符之后

問題描述

3 個解決方案

解決方案1 2 已采納 2021-03-25 05:47:13

解決方案2 0 2021-03-25 05:42:58

解決方案3 0 2021-03-25 05:52:54

解決方案1
2 已采納 2021-03-25 05:47:13

解決方案2
0 2021-03-25 05:42:58

解決方案3
0 2021-03-25 05:52:54