將已處理的文本存儲在pandas數據框中

Question

我已經使用gensim在Python中進行文本匯總。 我希望將匯總的輸出存儲在同一數據框中的不同列中。

我使用了以下代碼：

for n, row in df_data_1.iterrows():
        text=df_data_1['Event Description (SAP)']
        print(text)
        *df_data_1['Summary']=summarize(text)*
print(df_data_1['Summary'])

該代碼的第4行出現錯誤，該錯誤指出：TypeError：預期的字符串或類似字節的對象。

如何將處理后的文本存儲在pandas數據框中

Answer 1

如果不是字符串或字節，那是什么？ 您可以檢查匯總功能的類型，然后從那里繼續前進。

test_text = df_data_1['Event Description (SAP)'].iloc[0]
print(type(summarize(test_text))

另一點評論：通常，您希望避免在數據框上循環（請參閱討論）。 如果要將函數應用於整個列，請按以下方式使用df.apply（）：

df_data1[‘Summary’] = df_data1['Event Description (SAP)'].apply(lambda x: summarize(x))

將已處理的文本存儲在pandas數據框中

問題描述

1 個解決方案

解決方案1
0 2018-06-27 12:21:18

將已處理的文本存儲在pandas數據框中

問題描述

1 個解決方案

解決方案1 0 2018-06-27 12:21:18

解決方案1
0 2018-06-27 12:21:18