我们如何计算数据框列中的重复数据并将结果分配给同一数据框中的新列？

Question

我有几个地址，在数据帧的一列中，重复，我想计算欺骗。 我尝试了以下代码。

import pandas as pd
df = pd.read_csv('C:\\my_path\\lat_lon.csv')
df['count'] = df.groupby(['Street'])['Street'].count()
df['count'] = df.groupby(['Street'])[['Street']].count()

这给了我“计数”列中的所有 NAN 值。 所以，我接下来尝试了这个。

df = df.groupby(['Street']).size().reset_index(name='count')

这给了我“街道”和“计数”，但所有其他列都被删除了。 我试图对数据进行透视，并且计数是正确的，但我真的希望在原始数据框中的新列中进行计数。 在 Excel 中，这将是一个“countif”函数。

Answer 1

这个怎么样

from collections import Counter
data = (random.choice(["221B Baker Street", "10 Downing Street", "Arc de Triomphe - Champs-Élysées"]) for _ in range(50))
df = pd.DataFrame(data={"addresses":data})
Counter(df["addresses"])

它给

Counter({'221B Baker Street': 22, 'Arc de Triomphe - Champs-Élysées': 15, '10 Downing Street': 13})

我们如何计算数据框列中的重复数据并将结果分配给同一数据框中的新列？

问题描述

1 个解决方案

解决方案1
0 2020-10-16 00:41:03

我们如何计算数据框列中的重复数据并将结果分配给同一数据框中的新列？

问题描述

1 个解决方案

解决方案1 0 2020-10-16 00:41:03

解决方案1
0 2020-10-16 00:41:03