python pandas - 在groupby之后選擇特定值

Question

我有groupby表：

df.groupby(['Age', 'Movie']).mean()

                  User  Raitings
Age Movie
1   1         4.666667  7.666667
    2         4.666667  8.000000
    3         2.000000  7.500000
    4         2.000000  5.500000
    5         3.000000  7.000000
18  1         3.000000  7.500000
    2         3.000000  8.000000
    3         3.000000  8.500000
25  1         8.000000  7.250000
    2         8.000000  7.500000
    3         5.500000  8.500000
    4         5.000000  7.000000
45  1         9.000000  7.500000
    2         9.000000  7.500000
    3        11.000000  7.000000
    4        11.000000  6.000000
60  1         8.000000  7.000000
    2         8.000000  9.000000
    3         8.000000  7.000000

請幫助函數，它接受整數（年齡）並在此Age-group中返回帶有MIN raitings的電影。 示例def（1）應返回4（組Age（1）中的最小值Raitings = 1，電影（5.5）= 4）

我可以得到最小的Raiting：

df['Raitings'].min()

但我不知道 - 如何在特定群體（年齡）獲得raiting？

Answer 1

來源多指數DF：

In [221]: x
Out[221]:
                 User  Raitings
Age  Movie
1.0  1       4.666667  7.666667
     2       4.666667  8.000000
     3       2.000000  7.500000
     4       2.000000  5.500000
     5       3.000000  7.000000
18.0 1       3.000000  7.500000
     2       3.000000  8.000000
     3       3.000000  8.500000
25.0 1       8.000000  7.250000
     2       8.000000  7.500000
     3       5.500000  8.500000
     4       5.000000  7.000000
45.0 1       9.000000  7.500000
     2       9.000000  7.500000
     3      11.000000  7.000000
     4      11.000000  6.000000
60.0 1       8.000000  7.000000
     2       8.000000  9.000000
     3       8.000000  7.000000

功能：

In [222]: def f(df, age):
     ...:     return df.loc[pd.IndexSlice[age,:], 'Raitings'].idxmin()[1]
     ...:

測試：

In [223]: f(x, age=1)
Out[223]: 4

Answer 2

這樣就可以一次性完成所有這些工作。

df.groupby('Age').Raitings.idxmin().str[-1]

Age
1     4
18    1
25    4
45    4
60    1
Name: Raitings, dtype: int64

如果你想要一個函數，我會使用pd.DataFrame.xs （xs代表橫截面）。
默認情況下， xs將從索引的第一級抓取並隨后降低該級別。 這方便地留下了我們想要繪制idxmin將給我們的值的水平。

def f(df, age):
    return df.xs(age).Raitings.idxmin()

f(df, 1)

4

設定
對於那些試圖解析這些東西的人很有用。

txt = """\
Age  Movie       User  Raitings
1.0  1       4.666667  7.666667
     2       4.666667  8.000000
     3       2.000000  7.500000
     4       2.000000  5.500000
     5       3.000000  7.000000
18.0 1       3.000000  7.500000
     2       3.000000  8.000000
     3       3.000000  8.500000
25.0 1       8.000000  7.250000
     2       8.000000  7.500000
     3       5.500000  8.500000
     4       5.000000  7.000000
45.0 1       9.000000  7.500000
     2       9.000000  7.500000
     3      11.000000  7.000000
     4      11.000000  6.000000
60.0 1       8.000000  7.000000
     2       8.000000  9.000000"""

df = pd.read_fwf(pd.io.common.StringIO(txt))
df = df.ffill(downcast='infer').set_index(['Age', 'Movie'])

Answer 3

如果您想要特定年齡的最低要求，您可以：

df["Age"==1]['Raitings'].min()

如果要對整個數據幀執行此操作，可以執行以下操作：

df.groupby("Age").agg({ "Raitings" : "min" })

我希望它有所幫助，

Answer 4

我會重塑並做點。 認為這會有所幫助

df.reset_index(inplace = true)
df_Min = pd.pivot_table(df,index = [‘Movie’, ‘User’], columns =‘Age’, values = ‘Raiting’, aggfunc = min )

python pandas - 在groupby之后選擇特定值

問題描述

4 個解決方案

解決方案1
4 已采納 2018-02-17 16:34:06

解決方案2
4 2018-02-17 16:49:21

解決方案3
0 2018-02-17 16:32:02

解決方案4
0 2018-02-17 18:16:03

python pandas - 在groupby之后選擇特定值

問題描述

4 個解決方案

解決方案1 4 已采納 2018-02-17 16:34:06

解決方案2 4 2018-02-17 16:49:21

解決方案3 0 2018-02-17 16:32:02

解決方案4 0 2018-02-17 18:16:03

解決方案1
4 已采納 2018-02-17 16:34:06

解決方案2
4 2018-02-17 16:49:21

解決方案3
0 2018-02-17 16:32:02

解決方案4
0 2018-02-17 18:16:03