繁体   English   中英

将一系列字符串连接成 Pandas Dataframe 列中的单个字符串(对于每一行)?

[英]Concatenating a series of strings into a single string within a Pandas Dataframe column (for each row)?

这真的让我陷入了困境。 在 pandas dataframe (df) 我有以下内容:

日期 消息
2021-02-03 今天发生了一些随机事件。
2021-02-03 我们在 Stack Overflow 上提出了一个问题。
2021-02-02 天气很好。
2021-02-02 你好。 世界。

date 列是日期格式的索引,News 列是一个字符串。 我想要做的是合并重复的日期并加入或连接新闻列,例如:

日期 消息
2021-02-03 今天发生了一些随机事件。 我们在 Stack Overflow 上提出了一个问题。
2021-02-02 天气很好。 你好。 世界。

到目前为止,我有:

df = df.groupby(['date']).agg({'News': list})

然而,虽然这确实结合了重复的日期,但它会将字符串值放在一个列表中,或者更确切地说,根据我在尝试加入它们时遇到的错误,将它们放入一个系列中。 在这一点上,我完全迷失了,任何能引导我找到正确的pythonic方式的提示/提示将不胜感激!

PS:如果可能的话,我想避免使用循环,因为这需要多次解析大约 20 万条记录(作为函数)。 如果有什么不同,我将在 News 列上使用 TextBlob 来执行情绪分析。

Quang Hoang完美地回答了这个问题! 虽然我无法将其标记为可悲的答案 =(

df.groupby('date')['News'].agg(''.join)。 – Quang Hoang 2 月 8 日 15:08

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM