簡體   English   中英

如何在R數據幀中剪切乳膠首字母縮寫鏈

[英]How cut latex acronym chain in R dataframe

我有一個帶有我的首字母縮寫定義的乳膠文件:

\newacronym{AEP}{AEP}{Alimentation en Eau Potable}
\newacronym{AERMC}{AERMC}{Agence de l'Eau Rhône Méditerranée et Corse}
\newacronym[longplural=Cotes d'Abondance Numériques]{CAN}{CAN}{Cote d'Abondance Numérique}

我的目標是要有一個包含兩列的數據框,例如:

AEP     Alimentation en Eau Potable
AERMC   Agence de l'Eau Rhône Méditerranée et Corse
CAN     Cote d'Abondance Numérique

我認為使用正則表達式或strsplit公式是可行的,但由於{

acronymes <- read_lines("acronymes.tex")
acronymes <- as.tbl(as.data.frame(acronymes))
acronymes %>% 
    rename(Complet = acronymes) %>% 
    filter(!grepl("^%.*", Complet)) # Because I have non used lines
acronymes$ABR <- sub("}.*","", acronymes$Complet)

您對正則表達式有想法或明確的手冊嗎? 謝謝

也許不是最優雅的解決方案,但這是可行的。 您需要使用雙反斜杠將花括號轉義:

a <- readLines("acronymes.tex")
acronyms <- gsub(".*\\}\\{(.*)\\}\\{.*", "\\1", a)
descriptions <- gsub(".*\\}\\{(.*)\\}$", "\\1", a)
data.frame(acronyms, descriptions)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM