簡體   English   中英

如何使用具有NaN值的熊貓計算中位數?

[英]How to calculate medians using pandas with NaN values?

我有一個導入的csv文件,並且有59列。 我想計算每列中的中位數。

每列與行一樣具有NaN值和實整數值的混合。

在此處輸入圖片說明

我必須保留所有記錄,因為每一行中都有有效的度量值,如果按列或行刪除NaN值,則我的數據集為空。

我將NaN設置為零,但我無法讓它忽略0值。

目前,我擁有站點編號和其他相應的度量,並以獨立單位的形式刪除每列的NaN值,但這非常耗時。

有沒有更好的方法來計算給定數據情況下的中位數?

pandas.DataFrame.median默認情況下pandas.DataFrame.median忽略NaN ,您必須將skipna標志顯式更改為False才能包含NaN/null值。

df = pd.DataFrame({'col1': [1,2,3,np.nan, 4,5], 'col2': [4,5,6,np.nan, np.nan,7]})

df.median()

col1    3.0
col2    5.5
dtype: float64

df.median(skipna=False)

col1   NaN
col2   NaN
dtype: float64

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM