簡體   English   中英

如何對 pandas 和 python 中的多列進行分組?

[英]How to groupby multiple columns in pandas and python?

我有一個 Dataframe,我想用多列執行groupby

如果我通過代碼 select 列,它可以工作。

我想要的是允許用戶從列列表中獲取 select ,並返回groupby result

當我添加此行時,系統崩潰並顯示以下錯誤:

dda = df.groupby([primary_col_pyplot, [selected_column_names__pyplot]]) \
    .size() \
    .reset_index(name="count")

錯誤:

 ValueError: Grouper and axis must be same length

代碼:

import pandas as pd
import streamlit as st

df = pd.DataFrame({"source_number": [11199, 11328, 11287, 32345,
                                     12342, 1232, 12342, 123244, 1235],
                   "location": ["USA", "USA", "USA", "INDIA", "INDIA",
                                "USA", "INDIA", "USA", "INDIA"],
                   "category": ["cat1", "cat2", "cat1", "cat1", "cat2",
                                "cat1", "cat2", "cat1", "cat1"],
                   })
df.head()

all_columns_names = df.columns.tolist()
primary_col_pyplot = st.selectbox("Primary Column To GroupBy", all_columns_names)
selected_column_names__pyplot = st.multiselect("Select Columns", all_columns_names)
dda = df.groupby(["category", "location", "source_number"])\
    .size()\
    .reset_index(name="count")
print(dda)

預期結果:

    category    location    source_number   count
0   cat1         INDIA             1235       1
1   cat1         INDIA             32345      1
2   cat1         USA               1232       1
3   cat1         USA               11199      1
4   cat1         USA               11287      1
5   cat1         USA               123244     1
6   cat2         INDIA             12342      2
7   cat2         USA               11328      1

在查找 streamlit 之后,我將假設您的 st.selectbox 僅提供一個字符串(要選擇的一列)。 st.multiselect 提供了一個列表。 (多列可供選擇)。 但如果這可能不正確,請嘗試調試它,並查看不同場景下的 primary_col_pyplot 和 selected_column_names__pyplot 的值,以確定。

所以我們有一個字符串和一個字符串列表。 然后連接的 groupby 將作為:

dda = df.groupby([primary_col_pyplot] + selected_column_names__pyplot) \
    .size() \
    .reset_index(name="count")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM