繁体   English   中英

应用函数在 2 个数据框中取匹配的列,循环列

[英]Apply function taking matching columns in 2 data frames, looping over columns

我有以下两个数据框

df1 <- as.data.frame(matrix(runif(50), nrow = 10, byrow = TRUE))
colnames(df1) <- c("x1", "x2", "x3", "x4", "x5")
df2 <- as.data.frame(matrix(runif(100), nrow = 20, byrow = TRUE))
colnames(df2) <- c("x1", "x2", "x3", "x4", "x5")

我想测试列 x_j 的平均值是否与 2 个 dfs 相同,对于 j=1,...,5,记录测试统计量和 p 值。

t.test(df1$x1, df2$x1)$statistic
t.test(df1$x1, df2$x1)$p.value

apply() 似乎只接受一个 df 作为输入? 在 j 上循环上述 2 行的最佳方法是什么?

提前致谢!

applylapplyvapplysapply都在单个对象上循环。 如果你有m ultiple,你想mapplyMap

mapply(function(x,y) t.test(x,y)[c("statistic","p.value")], df1, df2)
#          x1        x2        x3         x4        x5       
#statistic 0.6816886 -1.408304 -0.2598513 -0.890468 -1.097354
#p.value   0.5028386 0.1721202 0.7982655  0.3825847 0.2851621

这假设df1df2都在相同的列顺序中。

您可以使用 R 中的常规for循环通过循环列名来实现此目的。

cols <- c("x1", "x2", "x3", "x4", "x5")
df1 <- as.data.frame(matrix(runif(50), nrow = 10, byrow = TRUE))
colnames(df1) <- cols
df2 <- as.data.frame(matrix(runif(100), nrow = 20, byrow = TRUE))
colnames(df2) <- cols

for (col in cols) {
  message(paste("Testing column", col, collapse = " "))
  print(paste("t-statistic: ", t.test(df1[col], df2[col])$statistic[["t"]]))
  print(paste("p-value:     ", t.test(df1[col], df2[col])$p.value))
}
#> Testing column x1
#> [1] "t-statistic:  0.419581290015361"
#> [1] "p-value:      0.68029340912263"
#> Testing column x2
#> [1] "t-statistic:  -0.343435717107623"
#> [1] "p-value:      0.7361266387073"
#> Testing column x3
#> [1] "t-statistic:  0.248037735890824"
#> [1] "p-value:      0.807107717907307"
#> Testing column x4
#> [1] "t-statistic:  0.992363174130968"
#> [1] "p-value:      0.333989277352541"
#> Testing column x5
#> [1] "t-statistic:  2.06600413500528"
#> [1] "p-value:      0.0527652252424411"

reprex 包(v0.3.0) 于 2020 年 11 月 2 日创建

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM