按條件子集一個python數據幀

Question

我試圖選擇計數> 250的名稱行，這里稱為有效。 所以我們將嘗試找到它的速率的平均值

t3=dfnew.groupby('name')['ratings']
t4=t3.count()
t5=t4[t4.values>250]
t6=t3.mean()
t6[(t6.index==t5.index)]

顯然問題出在我代碼的最后一行。 我想將 t6 的索引與 t5 的索引相匹配的地方。 如果它們匹配，則保存它，否則將其忽略。 這有點像 SQL 中的內部聯接。

我應該怎么做才能修改最后一行？

假設數據框是這樣的

input:
name ratings
    A  1
    A  2
    :
    A  251
    B  1
    B  2
    :
    B  230

所以預期的結果應該是 126 ( (1+251)/2))

Output
A  126

Answer 1

t3=dfnew.groupby('name')['ratings'].agg(['count','mean'])

t5=t3[t3['count']>250]
t5

當我同時聚合兩個函數時，它工作正常。