簡體   English   中英

如何在另一列的pandas df列中獲取與子字符串匹配的字符串?

[英]How do I get strings that match substrings in a pandas df column in another column?

我有一個字符串,技能和一個pandas數據框列表,其中每行描述標記為“作業摘要”。 我想看看Skills中的任何字符串是否是“作業摘要”列中的子字符串。 如果存在匹配,則匹配的字符串將出現在標記為匹配的列中。 如果有多個,那么它應該顯示為字符串列表。 現在我有它,所以它告訴我是對還是錯,但我希望這些單詞本身匹配。

看看我目前在下面有什么

     #Sample list (Real list is much longer)
     Skills=['Science', 'Management','Equipment','Analysis']
     skills=list(map(str.lower,skills))

     joined='|'.join(skills)

     df['Matches']=df['Job Summary'].str.contains(joined)

結果df ['匹配']告訴我是對還是錯。 我想要匹配的單詞

使用str.findall

df=pd.DataFrame({'Job Summary':['Science Equipment','Analysis is Management']})
df['Job Summary'].str.findall('|'.join(Skills))
Out[95]: 
0      [Science, Equipment]
1    [Analysis, Management]
Name: Job Summary, dtype: object

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM