[英]How to compare if list of items are present in each row of a dataframe in python
我有一個大小為88k,76列的data_file
。
我想比較列表: subset
= [40,49]在多少行中存在
我一次比較一行,如下所示:
我的代碼:
counter=0
for row in data_file.itertuples():
if all(np.isin(subset, row)):
counter = counter+1
print('Total occurences of subset: ', subset, '= ', counter)
print('--------------------------')
執行時間:6.6398055266834035
是否有更好的方式一次比較所有行並節省一些時間。 我需要檢查可能的子集,所以我的代碼的時間復雜度很高。
謝謝,
戈皮
np.sum((data_file==subset[0]).any(axis=1) & (data_file==subset[1]).any(axis=1))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.