簡體   English   中英

將已處理的文本存儲在pandas數據框中

[英]Storing processed text in pandas dataframe

我已經使用gensim在Python中進行文本匯總。 我希望將匯總的輸出存儲在同一數據框中的不同列中。

我使用了以下代碼:

for n, row in df_data_1.iterrows():
        text=df_data_1['Event Description (SAP)']
        print(text)
        *df_data_1['Summary']=summarize(text)*
print(df_data_1['Summary'])

該代碼的第4行出現錯誤,該錯誤指出:TypeError:預期的字符串或類似字節的對象。

如何將處理后的文本存儲在pandas數據框中

如果不是字符串或字節,那是什么? 您可以檢查匯總功能的類型,然后從那里繼續前進。

test_text = df_data_1['Event Description (SAP)'].iloc[0]
print(type(summarize(test_text))

另一點評論:通常,您希望避免在數據框上循環(請參閱討論 )。 如果要將函數應用於整個列,請按以下方式使用df.apply()

df_data1[‘Summary’] = df_data1['Event Description (SAP)'].apply(lambda x: summarize(x))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM