[英]What does na.rm=TRUE actually means?
每當我們的數據中有 NA 時,我們使用 na.rm=TRUE 來獲得平均值、模式等的正確結果。 na.rm 做什么? 我可以理解 rm 是用來刪除的,我們甚至可以用它來刪除變量。但是為什么我們把 na 寫成小的呢? R 區分大小寫? Boolean 值 TRUE 在這里有什么作用?
參數na.rm
提供了一種從數據中刪除缺失值的簡單方法,如果它們被編碼為NA
。 在基礎 R 中,其標准默認值為FALSE
,這意味着不刪除NA
。
考慮以下具有 2 個元素的向量,其中一個是缺失值。
x <- c(1, NA)
現在,它的平均值是多少?
我們應該添加所有非缺失值並除以其全長2 嗎? 或者我們應該在刪除NA
后除以它的長度,只有 1?
sum(x, na.rm = TRUE)/length(x)
#[1] 0.5
sum(x, na.rm = TRUE)/length(x[!is.na(x)])
#[1] 1
如果使用mean
,則計算的是后者。
mean(x, na.rm = TRUE)
#[1] 1
na.rm
是許多功能中的 arguments 之一(您給出了一些示例)。 要獲取有關 function 的 arguments 的信息,請運行?function
。
例如,使用mean()
,運行:
?mean
為您提供您正在尋找的信息:
na.rm:一個邏輯值,指示在計算繼續之前是否應該去除 NA 值。
通過為該參數提供一個邏輯值( TRUE
或FALSE
),您可以選擇在運行 function 時是否剝離 NA。 默認值(也由mean()
文檔給出)是FALSE
。
是的:R 區分大小寫。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.