[英]Speed-up a parallel process calculating a mann-kendall test over a huge dataset in R
[英]Running Mann-Kendall on multiple columns in r
我是 R 新手,想一次在多個列上運行 mann-kendall。
structure(list(Year = c(1997, 1999, 2001, 2002), pH = c(8, 8.4,
8.2375, 8.27333333333333), Colour = c(16, 50.5, 21, 17.9090909090909
)), row.names = c(NA, -4L), class = c("tbl_df", "tbl", "data.frame"
))
這是我的數據示例
這是我為單個列嘗試的內容
MannKendall(NoordAnnual$Colour)
# tau = -0.137, 2-sided pvalue =0.4173
我希望得到一個表,其中包含所有列的 tau 和 p 值。
我們可以使用lapply
來遍歷感興趣的列。 在這里,第一列被刪除,因為它是“年”
library(Kendall)
out <- lapply(NoordAnnual[-1], MannKendall)
out
#$pH
#tau = 0.333, 2-sided pvalue =0.7341
#$Colour
#tau = 0, 2-sided pvalue =1
或者用dplyr
library(dplyr)
NoordAnnual %>%
summarise(across(-1, ~list(MannKendall(.))))
如果我們想當一張桌子
library(tidyr)
library(broom)
NoordAnnual %>%
summarise(across(-1, ~list(MannKendall(.) %>%
tidy %>%
select(p.value, statistic)))) %>%
pivot_longer(everything()) %>%
unnest(c(value))
# A tibble: 2 x 3
# name p.value statistic
# <chr> <dbl> <dbl>
#1 pH 0.734 0.333
#2 Colour 1 0
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.