R dplyr::按用戶定義的函數匯總組

Question

我有一個包含三個變量（基因、樣本、copy_number）的 data.frame，我想對按基因名稱分組的 copy_number 進行匯總統計。

我嘗試在 dplyr 中使用匯總 function 但一直失敗。

我想要具有或多或少特定corrected_copy_number的樣本數量

數據看起來像這樣（截斷）

> sub.melt.df.annotations.cna.genes
       Gene_Names          sample corrected_copy_number
3234        BRCA1 sample1                     6
7317        BRCA2 sample1                     1
10500       ERBB2 sample1                     4
11258       GATA3 sample1                     3
3234        GATA3 sample2                     2
7317        BRCA2 sample2                     1
10500       ERBB2 sample2                     3
.
.
11258       GeneX sampleN                     #



> sub.melt.df.annotations.cna.genes %>% group_by(Gene_Names) %>% dplyr::summarise(count=n(), min(corrected_copy_number),gain=n((corrected_copy_number>2)))
Error: Problem with `summarise()` input `gain`.
x unused argument ((corrected_copy_number > 2))
ℹ Input `gain` is `n((corrected_copy_number > 2))`.
ℹ The error occurred in group 1: Gene_Names = "BRCA1".
Run `rlang::last_error()` to see where the error occurred.

感謝您的幫助

Answer 1

將n(corrected_copy_number>2)替換為sum(corrected_copy_number>2) 。

R dplyr::按用戶定義的函數匯總組

問題描述

1 個解決方案

解決方案1
1 2020-08-17 15:37:38

R dplyr::按用戶定義的函數匯總組

問題描述

1 個解決方案

解決方案1 1 2020-08-17 15:37:38

解決方案1
1 2020-08-17 15:37:38