刪除所有最小值和最大值，然后在R中找到平均值

Question

我有以下數據集：

wow <- data.frame(a = c(1, 1, 1, 2, 3, 4, 4), b = c(3, 4, 2, 6, 2, 6, 5), c = c(1, 6, 3, 6, 1, 8, 9))
print(wow)
  a b c
1 1 3 1
2 1 4 6
3 1 2 3
4 2 6 6
5 3 2 1
6 4 6 8
7 4 5 9

我需要從每列中刪除所有最小值和最大值，然后計算剩余值的平均值，以便結果如下所示：

print(result)
    a  b    c
1 2.5  4 5.75

我發現了一個已經回答過的類似問題（數據框中的行值，不包括R中的最小值和最大值），但最大的區別在於，詢問該問題的人只處理每列中的單個最小值和最大值，雖然我可以在列中有多個最小值和最大值。

Answer 1

我們可以使用%in%刪除每列中min和max的值，並從剩余值中獲取mean 。 這是可以做到無論是summarise_each從dplyr

library(dplyr)
summarise_each(wow,funs(mean(.[!.%in% c(min(.), max(.))])))
#    a b    c
#1 2.5 4 5.75

或使用base R

sapply(wow, function(x) mean(x[!x %in% range(x)]))
#   a    b    c 
#2.50 4.00 5.75

Answer 2

一個data.table解決方案（ 1.9.5+ ，但可以很容易地適應）返回一個data.frame的對象，它似乎是你想要的：

library(data.table)
setDT(wow)[,lapply(.SD,function(x)mean(x[x>min(x)&x<max(x)]))]

或者，拉 @akrun

setDT(wow)[,lapply(.SD,function(x)mean(x[!x%in%range(x)]))]

根據您的數據，您可能需要na.rm=T ; 應該有一種方法可以用.GRP來做到這一點，但我認為它最終會比上面更長。

如果你想讓result成為一個向量，請使用sapply （在這種情況下， data.frame解決方案基本相同， data.table的唯一優勢就是速度）。

刪除所有最小值和最大值，然后在R中找到平均值

問題描述

2 個解決方案

解決方案1
4 已采納 2015-07-06 20:56:17

解決方案2
4 2015-07-06 21:42:34

刪除所有最小值和最大值，然后在R中找到平均值

問題描述

2 個解決方案

解決方案1 4 已采納 2015-07-06 20:56:17

解決方案2 4 2015-07-06 21:42:34

解決方案1
4 已采納 2015-07-06 20:56:17

解決方案2
4 2015-07-06 21:42:34