繁体   English   中英

如何从 dataframe 中随机 select 行,其中行偏度大于 R 中的给定值

[英]How to randomly select row from a dataframe for which the row skewness is larger that a given value in R

我正在尝试 select 从具有 1000 行(和六列)的数据帧中随机行,其中行的偏度大于给定值(例如 Sk > 0.3)。

我已经生成了以下数据框

df=data.frame(replicate(6,sample(10:100,1000,rep=TRUE)))

我可以从fbasics package 中得到行偏度:

rowSkewness(df)给出:

   [8] -0.2243295435  0.5306809351  0.0707122386  0.0341447417  0.3339384838 -0.3910593364 -0.6443905090
  [15]  0.5603809206  0.4406091534 -0.3736108832  0.0397860038  0.9970040772 -0.7702547535  0.2065830354 

但是现在,我需要 select 说 df 的 10 行,它们的行偏度大于 0.1... 可能与

for (a in 1:10) {
  sample.data[a,] = sample(x=df[wich(rowSkewness(df[sample(1:nrow(df),1)>0.1),], size = 1, replace = TRUE)
}

或类似的东西?

对此的任何想法将不胜感激。 提前致谢。

知道了:

x=df %>% filter(rowSkewness(df)>0.1)
for (a in 1:samplesize) {
  sample.data[a,] = sample(x=x, size = 1, replace = TRUE)
}

您可以使用 sample_n() function 或 sample_frac() - 使您的版本更短一些:

library(tidyr)
library(fBasics)
df=data.frame(replicate(6,sample(10:100,1000,rep=TRUE)))
x=df %>% dplyr::filter(rowSkewness(df)>0.1)  %>% dplyr::sample_n(10)

只做一个子集:

res1 <- DF[fBasics::rowSkewness(DF) > .1, ]

head(res1)
#    X1 X2 X3 X4 X5 X6
# 7  56 28 21 93 74 24
# 8  33 56 23 44 10 12
# 12 29 19 29 38 94 95
# 13 35 51 54 98 66 10
# 14 12 51 24 23 36 68
# 15 50 37 81 22 55 97

或使用e1071::skewness

res2 <- DF[apply(as.matrix(DF), 1, e1071::skewness) > .1, ]

stopifnot(all.equal(res1, res2))

数据

set.seed(42); DF <- data.frame(replicate(6, sample(10:100, 1000, rep=TRUE)))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM