[英]How to extract the characters from a string that are inside parentheses?
DataFrame圖片:
我在DataFrame中有一列名為Contracting的列,另一列為Contractor。
例如,我需要將列承包商分解為2個新列:一列包含括號內的財務編號,另一列包含所有其余內容(描述)。
例:
Contractor: Meo(504615947)
我需要它變成:
Contractor_Name: Meo and Contractor_Number:504615947
我試圖這樣做:
proc_2013[['contractor_description', 'contractor_NIF']]= pd.DataFrame(proc_2013['contractor'].str.split(('('),1).tolist())
proc2013['contractor_NIF'] = proc2013.contractor_NIF.str.extract('(\d+)')
問題一:
我也可以在括號內輸入名稱說明,然后輸入要提取的數字。
問題2:
有時,如果承包商來自國外,則在財政編號的開頭有一個字母(不僅是我最初假設的編號,使用第二行代碼)。
所有財務編號都有9位數字。
對於任何字母數字,您都可以將\\d
更改為\\w
:
proc2013['contractor_NIF'] = proc2013.contractor_NIF.str.extract('\((\w+)\)')
據我所能理解的您的問題,這可能是一個可能的解決方案,
df['contractor_name']=list(map(lambda x : x.split('(')[0],df['con']))
df['contractor_number']=list(map(lambda x : x.split('(')[-1][-10:-1],df['contractor']))
希望這可以幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.