[英]Trying to create a bag of words of Panda's df
我是熊貓新手(對Python還是有些新手),並且正在嘗試為特定列的每一行創建一袋單詞。 這是我從中獲取代碼的地方,下面是我的嘗試:
for index, row in df.iterrows():
cell = df.Review2.iloc[index]
df['BOW'].iloc[index] = pd.Series([y for x in cell for y in x.split()]).value_counts()
這是我要在其上執行上述操作的數據幀中的單個單元(因此,沒有for循環可在所有行上進行迭代):
問題價格,說折扣6瓶甚至顯示減少檢查更改五星級的味道好這獲得最好的櫥櫃曾經偉大的酥脆得到最好的櫥櫃曾經偉大的酥脆本來買三瓶風買整個案子假日尼斯加州出租車駕駛室夢幻般令人驚喜的美味濃郁的味道1分的船促銷不錯
任何幫助是極大的贊賞!
import pandas as pd
from collections import Counter
df = pd.DataFrame({'review': ['Hello World Hello', 'Hi Bye Bye Bye']})
df['BOW'] = df.review.apply(lambda x: Counter(x.split(" ")))
review BOW
0 Hello World Hello {u'World': 1, u'Hello': 2}
1 Hi Bye Bye Bye {u'Bye': 3, u'Hi': 1}
我使用了pandas apply方法來處理所有行,而無需顯式地對其進行迭代。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.