[英]Make a list of all words in pandas dataframe column
我有以下數據框:
df = pd.DataFrame([{'c1':'Hello world'}, {'c1':'Hello all the world'}])
我想列出“c1”列中包含的所有單詞。 結果列表應如下所示:
list=['Hello','world','Hello','all','the','world']
我以為我可以遍歷數據框中的行,並為每一行循環遍歷“c1”中的單詞並將單詞輸出到列表中,但我無法使其工作。
你可以這樣做:
' '.join([i for i in df['c1']]).split()
嘗試:
df.stack().str.split("[^\w+]").explode().tolist()
輸出:
['Hello', 'world', 'Hello', 'all', 'the', 'world']
首先我們創建樣本df
和空列表a_list
df = pd.DataFrame([{'c1':'Hello world'},
{'c1':'Hello all the world'}])
a_list = []
下一步:這個for 循環遍歷列c1
中的每一行,處理每一行中的值,然后通過.extend
函數將輸出添加到a_list
。
從左到右,從機器人到上發生了什么:
for
: 開始循環。
value
: 是一個臨時變量,用於在 for 循環迭代的每個c1
行中存儲值。
df.c1
: 從df
選擇c1
列
.str.split()
: 訪問字符串值並在有空格的地方拆分( ' '
)
a_list.extend(value)
:添加到a_list
每個,現在是單詞列表,每次迭代的value
。
for value in df.c1.str.split(' '):
a_list.extend(value)
打印列表
print(a_list)
['Hello', 'world', 'Hello', 'all', 'the', 'world']
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.