[英]How can I select two characters in a string?
我知道這也許很容易解決,但是在網上尋找各種示例時,我沒有找到解決問題的正確示例。
我在列下的data.frame中有以下短語:
ID
p_IIJSJ;o_OODJ;l_jjjjw;g_jjjdI
p_HHDU;o_WWj;l_WWOJ;g_jjjDI
我想選擇兩個詞:一個以p_開頭,一個以g_開頭,並消除它們之間的所有其余詞。...您對此有何建議? 我正在嘗試使用gsub
但目前沒有成功。 提前多謝
一種strrsplit
的方法,
sapply(strsplit(x, ';'), function(i) paste(grep('p_|g_', i, value = TRUE), collapse = ';'))
#[1] "p_IIJSJ;g_jjjdI"
或順序始終相同(如@Jaap所述)
sapply(strsplit(df$ID,';'), function(x) paste(x[c(1,4)], collapse=';'))
我建議您使用stringr
package stringr
:
library(stringr)
a <- "p_IIJSJ;o_OODJ;l_jjjjw;g_jjjdI"
b <- "p_HHDU;o_WWj;l_WWOJ;g_jjjDI"
str_extract(string = a, pattern = c("p_[a-zA-Z]+", "g_[a-zA-Z]+"))
# [1] "p_IIJSJ" "g_jjjdI"
str_extract(string = b, pattern = c("p_[a-zA-Z]+", "g_[a-zA-Z]+"))
# [1] "p_HHDU" "g_jjjDI"
我們可以使用sub
sub(";*(p_\\w+).*;*(g_\\w+).*", "\\1;\\2", df1$ID)
#[1] "p_IIJSJ;g_jjjdI" "p_HHDU;g_jjjDI"
或搭配gsub
gsub("[^pg]_\\w+;", "", df1$ID)
#[1] "p_IIJSJ;g_jjjdI" "p_HHDU;g_jjjDI"
df1 <- structure(list(ID = c("p_IIJSJ;o_OODJ;l_jjjjw;g_jjjdI", "p_HHDU;o_WWj;l_WWOJ;g_jjjDI"
)), .Names = "ID", class = "data.frame", row.names = c(NA, -2L))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.