![](/img/trans.png)
[英]Python Pandas DataFrame convert columns of each row to one single column as Pandas Series
[英]Concatenating a series of strings into a single string within a Pandas Dataframe column (for each row)?
这真的让我陷入了困境。 在 pandas dataframe (df) 我有以下内容:
日期 | 消息 |
---|---|
2021-02-03 | 今天发生了一些随机事件。 |
2021-02-03 | 我们在 Stack Overflow 上提出了一个问题。 |
2021-02-02 | 天气很好。 |
2021-02-02 | 你好。 世界。 |
date 列是日期格式的索引,News 列是一个字符串。 我想要做的是合并重复的日期并加入或连接新闻列,例如:
日期 | 消息 |
---|---|
2021-02-03 | 今天发生了一些随机事件。 我们在 Stack Overflow 上提出了一个问题。 |
2021-02-02 | 天气很好。 你好。 世界。 |
到目前为止,我有:
df = df.groupby(['date']).agg({'News': list})
然而,虽然这确实结合了重复的日期,但它会将字符串值放在一个列表中,或者更确切地说,根据我在尝试加入它们时遇到的错误,将它们放入一个系列中。 在这一点上,我完全迷失了,任何能引导我找到正确的pythonic方式的提示/提示将不胜感激!
PS:如果可能的话,我想避免使用循环,因为这需要多次解析大约 20 万条记录(作为函数)。 如果有什么不同,我将在 News 列上使用 TextBlob 来执行情绪分析。
Quang Hoang完美地回答了这个问题! 虽然我无法将其标记为可悲的答案 =(
df.groupby('date')['News'].agg(''.join)。 – Quang Hoang 2 月 8 日 15:08
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.