根據另一個變量求和

Question

我有一個由兩個變量Contents和Time組成的數據集，如下所示：

Time          Contents
2017M01       123
2017M02       456
2017M03       789
.             .
.             .
.             .
2018M12       789

現在，我想創建一個將Contents匯總六個月的數字矢量，即我想將2017M01到2017M06加到一個數字，將2017M07到2017M12加到另一個數字，依此類推。

我可以通過建立索引來做到這一點，但我希望能夠在我的代碼中寫出：“從2017M01到2017M06對應於該序列的總和”。

我真的很感謝您的幫助！

Answer 1

您可以基於要分組的行數和元素數來創建分組變量。 對於您的情況，您希望每6行進行分組，以便您的數據框應被6整除。使用iris進行演示（它有150行，所以150/6 = 25）

rep(seq(nrow(iris)%/%6), each = 6)
  #[1]  1  1  1  1  1  1  2  2  2  2  2  2  3  3  3  3  3  3  4  4  4  4  4  4  5  5  5  5  5  5  6  6  6  6  6  6  7  7  7  7  7  7  8  8  8  8  8  8  9  9  9  9  9  9 10 10 10 10
 #[59] 10 10 11 11 11 11 11 11 12 12 12 12 12 12 13 13 13 13 13 13 14 14 14 14 14 14 15 15 15 15 15 15 16 16 16 16 16 16 17 17 17 17 17 17 18 18 18 18 18 18 19 19 19 19 19 19 20 20
#[117] 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 23 24 24 24 24 24 24 25 25 25 25 25 25

有很多方法可以處理您的調用方式。 這是一個自定義函數，可讓您執行此操作（即創建分組變量），

f1 <- function(x, df) {
    v1 <- as.numeric(gsub('[0-9]{4}M(.*):[0-9]{4}M(.*)$', '\\1', x))
    v2 <- as.numeric(gsub('[0-9]{4}M(.*):[0-9]{4}M(.*)$', '\\2', x))
    i1 <- (v2 - v1) + 1
    return(rep(seq(nrow(df)%/%i1), each = i1))
}

f1("2017M01:2017M06", iris)
  #[1]  1  1  1  1  1  1  2  2  2  2  2  2  3  3  3  3  3  3  4  4  4  4  4  4  5  5  5  5  5  5  6  6  6  6  6  6  7  7  7  7  7  7  8  8  8  8  8  8  9  9  9  9  9  9 10 10 10 10
 #[59] 10 10 11 11 11 11 11 11 12 12 12 12 12 12 13 13 13 13 13 13 14 14 14 14 14 14 15 15 15 15 15 15 16 16 16 16 16 16 17 17 17 17 17 17 18 18 18 18 18 18 19 19 19 19 19 19 20 20
#[117] 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 23 24 24 24 24 24 24 25 25 25 25 25 25

編輯：我們可以通過將最終結果與剩余時間的最終結果的max+1值重復來串聯，從而輕松地使函數與“非0余數”除法兼容

f1 <- function(x, df) {
    v1 <- as.numeric(gsub('[0-9]{4}M(.*):[0-9]{4}M(.*)$', '\\1', x))
    v2 <- as.numeric(gsub('[0-9]{4}M(.*):[0-9]{4}M(.*)$', '\\2', x))
    i1 <- (v2 - v1) + 1
    final_v <- rep(seq(nrow(df) %/% i1), each = i1)
    if (nrow(df) %% i1 == 0) {
        return(final_v)
    } else {
        remainder = nrow(df) %% i1
        final_v1 <- c(final_v, rep((max(final_v) + 1), remainder))
        return(final_v1)
    }
}

因此，對於具有20行，每組6個的數據幀，上述函數將產生結果：

f1("2017M01:2017M06", df)
#[1] 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 4 4

根據另一個變量求和

問題描述

1 個解決方案

解決方案1
1 已采納 2019-02-27 10:38:26

根據另一個變量求和

問題描述

1 個解決方案

解決方案1 1 已采納 2019-02-27 10:38:26

解決方案1
1 已采納 2019-02-27 10:38:26