如何在字符串中選擇兩個字符？

Question

我知道這也許很容易解決，但是在網上尋找各種示例時，我沒有找到解決問題的正確示例。

我在列下的data.frame中有以下短語：

ID
p_IIJSJ;o_OODJ;l_jjjjw;g_jjjdI
p_HHDU;o_WWj;l_WWOJ;g_jjjDI

我想選擇兩個詞：一個以p_開頭，一個以g_開頭，並消除它們之間的所有其余詞。...您對此有何建議？ 我正在嘗試使用gsub但目前沒有成功。 提前多謝

Answer 1

一種strrsplit的方法，

sapply(strsplit(x, ';'), function(i) paste(grep('p_|g_', i, value = TRUE), collapse = ';'))
#[1] "p_IIJSJ;g_jjjdI"

或順序始終相同（如@Jaap所述）

sapply(strsplit(df$ID,';'), function(x) paste(x[c(1,4)], collapse=';'))

Answer 2

我建議您使用stringr package stringr ：

library(stringr)

a <- "p_IIJSJ;o_OODJ;l_jjjjw;g_jjjdI"
b <- "p_HHDU;o_WWj;l_WWOJ;g_jjjDI"

str_extract(string = a, pattern = c("p_[a-zA-Z]+", "g_[a-zA-Z]+"))

# [1] "p_IIJSJ" "g_jjjdI"

str_extract(string = b, pattern = c("p_[a-zA-Z]+", "g_[a-zA-Z]+"))

# [1] "p_HHDU"  "g_jjjDI"

Answer 3

我們可以使用sub

sub(";*(p_\\w+).*;*(g_\\w+).*", "\\1;\\2", df1$ID)
#[1] "p_IIJSJ;g_jjjdI" "p_HHDU;g_jjjDI"

或搭配gsub

gsub("[^pg]_\\w+;", "", df1$ID)
#[1] "p_IIJSJ;g_jjjdI" "p_HHDU;g_jjjDI"

數據

df1 <- structure(list(ID = c("p_IIJSJ;o_OODJ;l_jjjjw;g_jjjdI", "p_HHDU;o_WWj;l_WWOJ;g_jjjDI"
)), .Names = "ID", class = "data.frame", row.names = c(NA, -2L))

如何在字符串中選擇兩個字符？

問題描述

3 個解決方案

解決方案1
2 2017-05-26 09:52:01

解決方案2
1 2017-05-26 10:31:57

解決方案3
0 2017-05-26 10:29:09

數據

如何在字符串中選擇兩個字符？

問題描述

3 個解決方案

解決方案1 2 2017-05-26 09:52:01

解決方案2 1 2017-05-26 10:31:57

解決方案3 0 2017-05-26 10:29:09

數據

解決方案1
2 2017-05-26 09:52:01

解決方案2
1 2017-05-26 10:31:57

解決方案3
0 2017-05-26 10:29:09