簡體   English   中英

熊貓字符串替換錯誤Python

[英]Pandas String Replace Error Python

我正在做一些網頁抓取工作,想刪除字符串的一部分。

PlayerDataHeadings = soup.select(".auflistung th")
PlayerDataItems = soup.select(".auflistung td")

    PlayerData = pd.DataFrame(
        {'PlayerDataHeadings': PlayerDataHeadings,
         'PlayerDataItems': PlayerDataItems
        })

上面的代碼創建一個數據框並按預期工作。 在“ PlayerDataHeadings”列中,我要刪除的每個值的開頭和結尾都有一個不必要的<th></th>

我使用的代碼是:

PlayerData['PlayerDataHeadings'].replace(
    to_replace['<th>', ':</th>'],
    value='',
    inplace=True
    )

這將返回“ NameError:名稱'to_replace'未定義”作為錯誤。

關於如何解決這個問題或更好的選擇的任何想法都將很棒

看來您想念=

to_replace=

或省略關鍵字並添加regex=True

PlayerData['PlayerDataHeadings'].replace(['<th>', ':</th>'], '', inplace=True, regex=True)

樣品:

PlayerData = pd.DataFrame({'PlayerDataHeadings':['<th>a:</th>','g']})
print (PlayerData)
  PlayerDataHeadings
0        <th>a:</th>
1                  g
  PlayerDataHeadings

PlayerData['PlayerDataHeadings'].replace(['<th>', ':</th>'], '', inplace=True, regex=True)
print (PlayerData)
  PlayerDataHeadings
0                  a
1                  g

使用所有關鍵字:

PlayerData['PlayerDataHeadings'].replace(to_replace=['<th>', ':</th>'],
                                         value='', 
                                         inplace=True, 
                                         regex=True)
print (PlayerData)
  PlayerDataHeadings
0                  a
1                  g

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM