我有熊貓數組，最初是一個csv文件。我想從該列的所有行中刪除一個特定的單詞：text

Question

這是熊貓數組：

id          text                                       spam
4016        Subject: re : vacation vince : i just found ... 0
4017        Subject: re : receipts from visit jim , than... 0
4018        Subject: re : enron case study update wow ! a...0
4019        Subject: re : interest david , please , call... 0
4020        Subject: news : aurora 5 . 2 update aurora ve...0

我想從所有行中刪除“文本”列中的“主題”一詞，使其變為：

id          text                                       spam
4016        re : vacation vince : i just found ...  0
4017        re : receipts from visit jim , than...  0
4018        re : enron case study update wow ! a...0
4019        re : interest david , please , call...  0
4020        news : aurora 5 . 2 update aurora ve...0

Answer 1

我認為您需要replace - ^表示每個字符串的開頭和\\s+一個或多個空格：

df['text'] = df['text'].replace('^Subject:\s+', '', regex=True)
print (df)
     id                                     text  spam
0  4016   re : vacation vince : i just found ...     0
1  4017   re : receipts from visit jim , than...     0
2  4018  re : enron case study update wow ! a...     0
3  4019   re : interest david , please , call...     0
4  4020  news : aurora 5 . 2 update aurora ve...     0

但是如果需要刪除前9字符，包括whitespace s：

df['text'] = df['text'].str[9:]

Answer 2

嘗試這個：

df.text = df.text.apply(lambda row: row[9:])

每行將在“文本”列處更改，其中前9個字符“主題：”已刪除。

我有熊貓數組，最初是一個csv文件。我想從該列的所有行中刪除一個特定的單詞：text

問題描述

2 個解決方案

解決方案1
2 已采納 2017-11-25 12:11:44

解決方案2
1 2017-11-25 12:06:02

我有熊貓數組，最初是一個csv文件。 我想從該列的所有行中刪除一個特定的單詞：text

問題描述

2 個解決方案

解決方案1 2 已采納 2017-11-25 12:11:44

解決方案2 1 2017-11-25 12:06:02

我有熊貓數組，最初是一個csv文件。我想從該列的所有行中刪除一個特定的單詞：text

解決方案1
2 已采納 2017-11-25 12:11:44

解決方案2
1 2017-11-25 12:06:02