[英]Storing processed text in pandas dataframe
我已經使用gensim在Python中進行文本匯總。 我希望將匯總的輸出存儲在同一數據框中的不同列中。
我使用了以下代碼:
for n, row in df_data_1.iterrows():
text=df_data_1['Event Description (SAP)']
print(text)
*df_data_1['Summary']=summarize(text)*
print(df_data_1['Summary'])
該代碼的第4行出現錯誤,該錯誤指出:TypeError:預期的字符串或類似字節的對象。
如何將處理后的文本存儲在pandas數據框中
如果不是字符串或字節,那是什么? 您可以檢查匯總功能的類型,然后從那里繼續前進。
test_text = df_data_1['Event Description (SAP)'].iloc[0]
print(type(summarize(test_text))
另一點評論:通常,您希望避免在數據框上循環(請參閱討論 )。 如果要將函數應用於整個列,請按以下方式使用df.apply() :
df_data1[‘Summary’] = df_data1['Event Description (SAP)'].apply(lambda x: summarize(x))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.