具有某些名稱的列的行總和

Question

我有一個樣本數據：

SampleID  a      b     d     f       ca      k     l    cb
1         0.1    2     1     2       7       1     4    3
2         0.2    3     2     3       4       2     5    5
3         0.5    4     3     6       1       3     9    2

我需要找到在名稱上具有某些共同點的列的按行sum(a, ca) ，例如按行sum(a, ca)或按行sum(b,cb) 。 問題是我有很大的data.frame，理想情況下，我將能夠寫出列標題中常見的內容，因此代碼只選擇那些列求和

預先感謝您的協助。

Answer 1

我們可以使用grep選擇具有'a'的列，對這些列進行子集化，並執行rowSums ，而對於'b'列進行選擇。

 rowSums(df1[grep('a', names(df1)[-1])+1])
 rowSums(df1[grep('b', names(df1)[-1])+1])

Answer 2

如果要將輸出作為數據幀，請嘗試使用dplyr

# Recreating your sample data
df <- data.frame(SampleID = c(1, 2, 3),
             a = c(0.1, 0.2, 0.5),
             b = c(2, 3, 4),
             d = c(1, 2, 3),
             f = c(2, 3, 6),
             ca = c(7, 4, 1),
             k = c(1, 2, 3),
             l = c(4, 5, 9),
             cb = c(3, 5, 2))

處理數據

# load dplyr
library(dplyr)

# Sum across columns 'a' and 'ca' (sum(a, ca))
df2 <- df %>%
    select(contains('a'), -SampleID) %>% # 'select' function to choose the columns you want 
    mutate(row_sum = rowSums(.)) # 'mutate' function to create a new column 'row_sum' with the sum of the selected columns. You can drop the selected columns by using 'transmute' instead.

df2 # have a look

    a ca row_sum
1 0.1  7     7.1
2 0.2  4     4.2
3 0.5  1     1.5

具有某些名稱的列的行總和

問題描述

2 個解決方案

解決方案1
2 已采納 2016-02-29 07:20:19

解決方案2
0 2016-02-29 10:23:18

具有某些名稱的列的行總和

問題描述

2 個解決方案

解決方案1 2 已采納 2016-02-29 07:20:19

解決方案2 0 2016-02-29 10:23:18

解決方案1
2 已采納 2016-02-29 07:20:19

解決方案2
0 2016-02-29 10:23:18