[英]Speed-up a parallel process calculating a mann-kendall test over a huge dataset in R
[英]Running Mann-Kendall on multiple columns in r
我是 R 新手,想一次在多个列上运行 mann-kendall。
structure(list(Year = c(1997, 1999, 2001, 2002), pH = c(8, 8.4,
8.2375, 8.27333333333333), Colour = c(16, 50.5, 21, 17.9090909090909
)), row.names = c(NA, -4L), class = c("tbl_df", "tbl", "data.frame"
))
这是我的数据示例
这是我为单个列尝试的内容
MannKendall(NoordAnnual$Colour)
# tau = -0.137, 2-sided pvalue =0.4173
我希望得到一个表,其中包含所有列的 tau 和 p 值。
我们可以使用lapply
来遍历感兴趣的列。 在这里,第一列被删除,因为它是“年”
library(Kendall)
out <- lapply(NoordAnnual[-1], MannKendall)
out
#$pH
#tau = 0.333, 2-sided pvalue =0.7341
#$Colour
#tau = 0, 2-sided pvalue =1
或者用dplyr
library(dplyr)
NoordAnnual %>%
summarise(across(-1, ~list(MannKendall(.))))
如果我们想当一张桌子
library(tidyr)
library(broom)
NoordAnnual %>%
summarise(across(-1, ~list(MannKendall(.) %>%
tidy %>%
select(p.value, statistic)))) %>%
pivot_longer(everything()) %>%
unnest(c(value))
# A tibble: 2 x 3
# name p.value statistic
# <chr> <dbl> <dbl>
#1 pH 0.734 0.333
#2 Colour 1 0
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.