簡體   English   中英

如何比較項目列表是否出現在python數據框的每一行中

[英]How to compare if list of items are present in each row of a dataframe in python

我有一個大小為88k,76列的data_file

我想比較列表: subset = [40,49]在多少行中存在

我一次比較一行,如下所示:

我的代碼:

counter=0
for row in data_file.itertuples():
    if all(np.isin(subset, row)):
        counter = counter+1
print('Total occurences of subset: ', subset, '= ', counter)
print('--------------------------')

執行時間:6.6398055266834035

是否有更好的方式一次比較所有行並節省一些時間。 我需要檢查可能的子集,所以我的代碼的時間復雜度很高。

謝謝,

戈皮

np.sum((data_file==subset[0]).any(axis=1) & (data_file==subset[1]).any(axis=1))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM