[英]Pandas String Replace Error Python
我正在做一些網頁抓取工作,想刪除字符串的一部分。
PlayerDataHeadings = soup.select(".auflistung th")
PlayerDataItems = soup.select(".auflistung td")
PlayerData = pd.DataFrame(
{'PlayerDataHeadings': PlayerDataHeadings,
'PlayerDataItems': PlayerDataItems
})
上面的代碼創建一個數據框並按預期工作。 在“ PlayerDataHeadings”列中,我要刪除的每個值的開頭和結尾都有一個不必要的<th>
和</th>
。
我使用的代碼是:
PlayerData['PlayerDataHeadings'].replace(
to_replace['<th>', ':</th>'],
value='',
inplace=True
)
這將返回“ NameError:名稱'to_replace'未定義”作為錯誤。
關於如何解決這個問題或更好的選擇的任何想法都將很棒
看來您想念=
:
to_replace=
或省略關鍵字並添加regex=True
:
PlayerData['PlayerDataHeadings'].replace(['<th>', ':</th>'], '', inplace=True, regex=True)
樣品:
PlayerData = pd.DataFrame({'PlayerDataHeadings':['<th>a:</th>','g']})
print (PlayerData)
PlayerDataHeadings
0 <th>a:</th>
1 g
PlayerDataHeadings
PlayerData['PlayerDataHeadings'].replace(['<th>', ':</th>'], '', inplace=True, regex=True)
print (PlayerData)
PlayerDataHeadings
0 a
1 g
使用所有關鍵字:
PlayerData['PlayerDataHeadings'].replace(to_replace=['<th>', ':</th>'],
value='',
inplace=True,
regex=True)
print (PlayerData)
PlayerDataHeadings
0 a
1 g
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.