如何在R數據幀中剪切乳膠首字母縮寫鏈

Question

我有一個帶有我的首字母縮寫定義的乳膠文件：

\newacronym{AEP}{AEP}{Alimentation en Eau Potable}
\newacronym{AERMC}{AERMC}{Agence de l'Eau Rhône Méditerranée et Corse}
\newacronym[longplural=Cotes d'Abondance Numériques]{CAN}{CAN}{Cote d'Abondance Numérique}

我的目標是要有一個包含兩列的數據框，例如：

AEP     Alimentation en Eau Potable
AERMC   Agence de l'Eau Rhône Méditerranée et Corse
CAN     Cote d'Abondance Numérique

我認為使用正則表達式或strsplit公式是可行的，但由於{

acronymes <- read_lines("acronymes.tex")
acronymes <- as.tbl(as.data.frame(acronymes))
acronymes %>% 
    rename(Complet = acronymes) %>% 
    filter(!grepl("^%.*", Complet)) # Because I have non used lines
acronymes$ABR <- sub("}.*","", acronymes$Complet)

您對正則表達式有想法或明確的手冊嗎？ 謝謝

Answer 1

也許不是最優雅的解決方案，但這是可行的。 您需要使用雙反斜杠將花括號轉義：

a <- readLines("acronymes.tex")
acronyms <- gsub(".*\\}\\{(.*)\\}\\{.*", "\\1", a)
descriptions <- gsub(".*\\}\\{(.*)\\}$", "\\1", a)
data.frame(acronyms, descriptions)

如何在R數據幀中剪切乳膠首字母縮寫鏈

問題描述

1 個解決方案

解決方案1
0 已采納 2016-10-18 16:09:03

如何在R數據幀中剪切乳膠首字母縮寫鏈

問題描述

1 個解決方案

解決方案1 0 已采納 2016-10-18 16:09:03

解決方案1
0 已采納 2016-10-18 16:09:03