![](/img/trans.png)
[英]How to extract all non-nan values in this dataframe by the non-nan values count of each row
[英]Count number of non-nan values in array
我有一個浮點數/南數值列表,如下所示:
a = [(9.62, np.nan, 0.063), (np.nan, np.nan, np.nan), (np.nan, 0.34, np.nan), (9.50, 2.65, 5.85), (np.nan, np.nan, np.nan), (8.9423173497260166e-06, np.nan, np.nan), (np.nan, np.nan, np.nan), (10.53906499271581, np.nan, 3.4981897643207153e-08), (27.945228892337656, np.nan, np.nan), (np.nan, np.nan, np.nan), (0.00015676098048248007, 428.53224664333368, 15.597030989617416), (3.219339103511719e-08, np.nan, np.nan), (351.3486881626871, 118.79412856376891, 96.925698744436318), (np.nan, np.nan, np.nan), (np.nan, np.nan, np.nan), (0.038185812702743384, 0.011979539923543838, 1.4161404311887908e-05), (6.5891883211951452, np.nan, np.nan), (np.nan, np.nan, np.nan), (np.nan, np.nan, np.nan), (np.nan, np.nan, np.nan), (0.01992113565158183, 1.0858887135978378e-08, 6.949483102803238e-08), (np.nan, np.nan, np.nan), (0.0053471054969118897, 32.364223190908589, 0.29950485126829518), (0.022687094833899225, np.nan, 3.3927513616780456e-05), (0.0065459356887503, 5.0304474154655309e-06, 6.1755309734841293e-06), (1.2854278279876815e-07, 110.94572059986106, 2.0737305081677166e-06), (2.8909153747692473, np.nan, np.nan), (np.nan, np.nan, np.nan), (0.00085244354118369653, np.nan, 547.28608997823414), (0.21609437779080298, 2.9772785752782283e-08, 0.024868855470372788), (np.nan, 1.0571674432090431e-08, np.nan), (np.nan, 0.00042711039439664552, np.nan), (np.nan, 3.7576842775630178e-09, np.nan), (np.nan, 1.2436122988008544e-08, np.nan), (np.nan, 0.008772060008242254, np.nan), (np.nan, 2.9731267579988852, np.nan), (np.nan, 152.69348161610276, np.nan), (np.nan, 1.7976907012194907, np.nan), (np.nan, 0.0006232073677262973, np.nan), (np.nan, 1.3468250342036237e-08, np.nan), (np.nan, 6.9699321813542907e-05, np.nan), (np.nan, 5.2001506649804148e-05, np.nan), (np.nan, np.nan, np.nan)]
ie:由N
個子列表組成,每個子列表包含相同數量的元素M
(在這種情況下為3,但它可以改變),其中每個元素都是float或np.nan
值(我的實際列表)有更大的N
和M
值)。
我需要有效地計算每個子列表中的非 np.nan
值的數量。 如果數字為零(所有np.nan
值),則應存儲np.nan
值。
最后名單/陣列看起來像(使用a
以上):
count = [2, nan, 1, 3, ...]
我嘗試使用np.count_nonzero(),但它將np.nan
視為非零,因此它將所有計數返回為3
。
您可以使用numpy.isnan
創建一個布爾數組,然后使用每行的sum
(軸= 1)計算True s:
import numpy as np
# count the non-nan values
non_nans = (~np.isnan(a)).sum(1)
# replace 0 count with np.nan
np.where(non_nans == 0, np.nan, non_nans)
# array([ 2., nan, 1., 3., nan, ...])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.