[英]Python Pandas Multiindexing select rows that match all values in a list
[英]Select all rows in Python pandas
我有一个 function 旨在在过滤要定义的某些行后沿着pandas
DataFrame
的列打印sum
; 以及这个数量在没有任何过滤器的情况下占相同总和的百分比:
def my_function(df, filter_to_apply, col):
my_sum = np.sum(df[filter_to_apply][col])
print(my_sum)
print(my_sum/np.sum(df[col]))
现在我想知道是否有任何方法可以让filter_to_apply
实际上不执行任何过滤器(即保留所有行),以继续使用我的 function(实际上有点复杂和方便),即使我不这样做想要任何过滤器。
因此,一些filter_f1
可以: df[filter_f1] = df
并且可以与其他过滤器一起使用: filter_f1 & filter_f2
。
一个可能的答案是: df.index.isin(df.index)
但我想知道是否有更容易理解的东西(例如,我试图只使用True
但它没有用)。
这是一种选择所有行的方法:
df[range(0, len(df))]
这也是
df[:]
但我还没有想出一种方法来传递:
作为参数。
在 Pandas 上有一个名为loc
的函数可以过滤行。 你可以这样做:
df2 = df.loc[<Filter here>]
#Filter can be something like df['price']>500 or df['name'] == 'Brian'
#basically something that for each row returns a boolean
total = df2['ColumnToSum'].sum()
Python 切片 object,即slice(-1)
充当 object,它选择可索引 object 中的所有索引。因此df[slice(-1)]
将 select 中的所有行DataFrame
. 您可以将其存储在一个变量中,您可以在您的逻辑中进一步完善该初始值:
filter_to_apply = slice(-1) # initialize to select all rows
... # logic that may set `filter_to_apply` to something more restrictive
my_function(df, filter_to_apply, col)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.