簡體   English   中英

完整熊貓數據框的標准偏差和平均值

[英]Standard deviation and mean of complete pandas dataframe

我有一個相當大的數據集,想計算所有列和行的平均值和標准差。 不幸的是,我還沒有為此找到合適的解決方案。 我的數據集看起來有點像(總共 600 行):

<code>df.head()</code> 數據集

當我使用 pandas 函數weekl_rtr.mean()我只是計算每列的平均值。 可能適用於平均值的解決方法應該是weekl_rtr.mean().mean() ,但這不適用於標准偏差。 你有什么想法,如何解決這個問題?

謝謝和親切的問候,

馬庫斯

據我所知,在熊貓中沒有直接的方法。 您有兩個選擇:

  1. 獲取底層 numpy 數組並在其上計算均值或標准差。 與熊貓相反,這將默認評估所有維度的函數。 例如,您可以在df.values.mean()中執行df.values.mean()df.to_numpy().mean()
  2. 將表轉換為單個列,然后對該列運行所需的操作

更改平均值和標准偏差的軸:

# Across columns (Default)
weekl_rtr.mean(axis = 0)
# or
weekl_rtr.mean()

# Across rows
weekl_rtr.mean(axis = 1)

這同樣適用於std() 您還應該查看df.describe() ,它描述了具有更多統計信息(平均值、標准、計數、最小值、最大值、百分位數)的 DataFrame:

# Across columns
weekl_rtr.describe()

# Across rows
weekl_rtr.apply(pd.DataFrame.describe, axis=1)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM