簡體   English   中英

使用NA計算列中值

[英]Calculate column medians with NA's

我試圖計算R中各列的中位數,然后用列中的每個值減去中值。 我在這里遇到的問題是我在我的專欄中有N / A,我不想刪除但只返回它們而不減去中位數。 例如

ID <- c("A","B","C","D","E") 
Point_A <- c(1, NA, 3, NA, 5) 
Point_B <- c(NA, NA, 1, 3, 2)

df <- data.frame(ID,Point_A ,Point_B)

是否可以計算具有N / A的柱的中值? 我的結果是

+----+---------+---------+
| ID | Point_A | Point_B |
+----+---------+---------+
| A  | -2      | NA      |
| B  | NA      | NA      |
| C  | 0       | -1      |
| D  | NA      | 1       |
| E  | 2       | 0       |
+----+---------+---------+

如果我們談論真正的NA值(根據OP評論),可以做到

df[-1] <- lapply(df[-1], function(x) x - median(x, na.rm = TRUE))
df
#   ID Point_A Point_B
# 1  A      -2      NA
# 2  B      NA      NA
# 3  C       0      -1
# 4  D      NA       1
# 5  E       2       0

或者使用matrixStats

library(matrixStats)
df[-1] <- df[-1] - colMedians(as.matrix(df[-1]), na.rm = TRUE)

當原始df

df <- structure(list(ID = structure(1:5, .Label = c("A", "B", "C", 
"D", "E"), class = "factor"), Point_A = c(1, NA, 3, NA, 5), Point_B = c(NA, 
NA, 1, 3, 2)), .Names = c("ID", "Point_A", "Point_B"), row.names = c(NA, 
-5L), class = "data.frame")

另一種選擇是

library(dplyr)
 df %>%
     mutate_each(funs(median=.-median(., na.rm=TRUE)), -ID)

當然有可能。

median(df[,]$Point_A, na.rm = TRUE)

其中df是數據框,而df [,]表示所有行和列。 但是,請注意$ Point_A之后指定的列。 同樣可以用這種表示法寫成:

median(df[,"Point_A"], na.rm = TRUE)

再次,df [,“Point_A”]表示列Point_A的所有行。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM