使用 dplyr 按行计算特殊字符的数量并变异为新列

Question

一个示例数据框：

example_df = data.frame(Gene.names = c("A", "B"),
                        Score = c("3.69,2.97,2.57,3.09,2.94",
                                  "3.99,2.27,2.89,2.89,2.00,2.52,2.09,2.83") )

我想计算“分数”列的每一行中用逗号分隔的“数字”（值）的数量，并创建一个新列，比如“计数”。 我怎样才能做到这一点？ 我试图用谷歌搜索，但在那里没有得到太多帮助。

Answer 1

我们可以在,使用str_count并加 1

library(stringr)
library(dplyr)
example_df %>% 
     mutate(Count = str_count(Score, ",") + 1)

-输出

#  Gene.names                                   Score Count
#1          A                3.69,2.97,2.57,3.09,2.94     5
#2          B 3.99,2.27,2.89,2.89,2.00,2.52,2.09,2.83     8

或者使用base R和gsub删除不是a ,的字符，用nchar获取字符数并加1

nchar(gsub("[^,]+", "", example_df$Score)) + 1
#[1] 5 8

Answer 2

另一个基本 R 选项是使用strsplit + lengths ，例如，

transform(
  example_df,
  Count = lengths(strsplit(Score,","))
)

这使

  Gene.names                                   Score Count
1          A                3.69,2.97,2.57,3.09,2.94     5
2          B 3.99,2.27,2.89,2.89,2.00,2.52,2.09,2.83     8

使用 dplyr 按行计算特殊字符的数量并变异为新列

问题描述

2 个解决方案

解决方案1
2 已采纳 2021-01-26 19:31:52

解决方案2
1 2021-01-26 21:12:13

使用 dplyr 按行计算特殊字符的数量并变异为新列

问题描述

2 个解决方案

解决方案1 2 已采纳 2021-01-26 19:31:52

解决方案2 1 2021-01-26 21:12:13

解决方案1
2 已采纳 2021-01-26 19:31:52

解决方案2
1 2021-01-26 21:12:13