R - 仅保留列名与字符串匹配的列

Question

我对 R 比较陌生，我很幸运在这里找到了答案，但是在尝试了 2 天之后，这个问题让我难倒了。

我有一个列名的数据框，如下所示：

TargetID sample1.beta sample1.avg sample1.error sample1.pval sample2.beta sample2.avg sample2.error sample2.pval

这对数千个样本重复。 我需要为每条数据创建多个单独的数据框：一个用于 beta，一个用于 avg，一个用于错误，一个用于 pval。 我还需要在所有数据框中保留带有 TargetID 的第一列。 生成的数据框将具有如下列名：

TargetID sample1.beta sample2.beta sample3.beta

目标ID sample1.pval sample2.pval sample3.pval

等。

我找到了对数据框进行子集化的答案，但它们似乎不适用于选择包含特定字符串的所有列（并保留第一列）。

在使用 awk 导入到 R 之前，我也一直在探索使用 txt 文件是否更好地完成此操作。

Answer 1

在 "[" 的第二个位置使用grepl或grep ，其模式包含TargetID和应用于names(dfrm_name)的子集字符串：

 avg_sub <- dfrm[ , grepl( "^TargetID|avg$", names(dfrm) ]

“^”模式匹配字符串的开头，而“$”模式匹配字符串的结尾。

Answer 2

您可以尝试（因为您不使用mtcars提供示例数据）：

library(dplyr)
# select the column mpg and all the columns containing an r
head(mtcars %>% select(mpg, contains("r")))
                   mpg drat gear carb
Mazda RX4         21.0 3.90    4    4
Mazda RX4 Wag     21.0 3.90    4    4
Datsun 710        22.8 3.85    4    1
Hornet 4 Drive    21.4 3.08    3    1
Hornet Sportabout 18.7 3.15    3    2
Valiant           18.1 2.76    3    1

R - 仅保留列名与字符串匹配的列

问题描述

2 个解决方案

解决方案1
1 已采纳 2016-03-25 17:14:01

解决方案2
1 2016-03-25 17:16:03

R - 仅保留列名与字符串匹配的列

问题描述

2 个解决方案

解决方案1 1 已采纳 2016-03-25 17:14:01

解决方案2 1 2016-03-25 17:16:03

解决方案1
1 已采纳 2016-03-25 17:14:01

解决方案2
1 2016-03-25 17:16:03