簡體   English   中英

Pandas:如何聚合多個列?

[英]Pandas: How to aggregate multiple columns?

如何創建以兩列作為輸入並輸出分數的 function; 具體來說, 推土機的距離

我找不到有關如何通過 groupby 實現它的文檔?

如果我了解您要完成的工作,您可以groupby.apply使用lambda或創建 function 和groupby.apply

from scipy.stats import wasserstein_distance
import pandas as pd
import numpy as np

df = pd.DataFrame([np.random.randint(0,10,2),
                   np.random.randint(0,10,2),
                   np.random.randint(0,10,2),
                   np.random.randint(0,10,2)], columns=list('AB'))

df['C'] = list('AABB')

# use apply with lambda function
print(df.groupby('C').apply(lambda df: wasserstein_distance(df['A'], df['B'])))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM