[英]Extracting string between 2 characters from Dataframe column
我有一列包含以下條目:Hello [World]。 我正在嘗試提取“世界”並用它創建一個新列,並為每一行執行此操作。
不知道該怎么做,我不熟悉正則表達式。
謝謝。
它看起來像這樣:
import pandas as pd
df = pd.DataFrame([['hello [world]'],['something [else]']], columns=['words']);
df['words'] = df['words'].str.replace('^.*\[|\]$','')
print(df)
唯一復雜的部分是正則表達式: replace('.*\[|\]$','')
。 這表示要查找單詞^
的開頭直到.*
[
字符 OR |
的第一個實例。 從字符串$
末尾的]
字符的第一個實例開始,並將其替換為空''
如果您要經常做這種事情,我強烈建議您學習正則表達式。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.