将已处理的文本存储在pandas数据框中

Question

我已经使用gensim在Python中进行文本汇总。 我希望将汇总的输出存储在同一数据框中的不同列中。

我使用了以下代码：

for n, row in df_data_1.iterrows():
        text=df_data_1['Event Description (SAP)']
        print(text)
        *df_data_1['Summary']=summarize(text)*
print(df_data_1['Summary'])

该代码的第4行出现错误，该错误指出：TypeError：预期的字符串或类似字节的对象。

如何将处理后的文本存储在pandas数据框中

Answer 1

如果不是字符串或字节，那是什么？ 您可以检查汇总功能的类型，然后从那里继续前进。

test_text = df_data_1['Event Description (SAP)'].iloc[0]
print(type(summarize(test_text))

另一点评论：通常，您希望避免在数据框上循环（请参阅讨论）。 如果要将函数应用于整个列，请按以下方式使用df.apply（）：

df_data1[‘Summary’] = df_data1['Event Description (SAP)'].apply(lambda x: summarize(x))

将已处理的文本存储在pandas数据框中

问题描述

1 个解决方案

解决方案1
0 2018-06-27 12:21:18

将已处理的文本存储在pandas数据框中

问题描述

1 个解决方案

解决方案1 0 2018-06-27 12:21:18

解决方案1
0 2018-06-27 12:21:18