使用dplyr在所選列上添加具有行方式意義的列

Question

我有一個數據框，其中包含幾個在不同時間點測量的變量（例如， test1_tp1 ， test1_tp2 ， test1_tp3 ， test2_tp1 ， test2_tp2 ，...）。

我現在嘗試使用dplyr向數據框添加一個新列，該數據框計算這些列的選擇上的行方式（例如， test1所有時間點的平均值）。

data %>% ... %>% mutate(test1_mean = mean(test1_tp1, test1_tp2, test1_tp3, na.rm = TRUE)

data %>% ... %>% mutate(test1_mean = mean(matches("test1_.*"), na.rm = TRUE)

Answer 1

您可以在select使用starts_with來查找以某個字符串開頭的所有列。

data %>%
  mutate(test1 = select(., starts_with("test1_")) %>%
           rowMeans(na.rm = TRUE))

Answer 2

以下是如何在dplyr中執行此操作 - 我使用iris數據作為示例：

iris %>% mutate(sum.Sepal = rowSums(.[grep("^Sepal", names(.))]))

這將計算以“Sepal”開頭的所有列的行和。 您可以以相同的方式使用rowMeans而不是rowSums 。

Answer 3

不是dplyr解決方案，但您可以嘗試：

cols_2sum <- grepl('test1',colnames(data))
rowMeans(data[,cols_2sum])