[英]Convert character vector to data.frame after str_extract()
I have a dataframe:我有一个 dataframe:
head(objeto)
Edital
1 GOVERNO DO ESTADO DE MINAS GERAIS
2 SECRETARIA-GERAL DA GOVERNADORIA DO ESTADO DE MINAS GERAIS
3 EDITAL DA CONCORRÊNCIA Nº 001/2012
4 EDITAL DE LICITAÇÃO
5 CONCORRÊNCIA Nº. 001/2012
6 TIPO: TÉCNICA E PREÇO
I want to find the regex "Objeto" in it, so:我想在其中找到正则表达式“Objeto”,所以:
regex.objeto <- "(?<=Objeto: )([^.]+)"
objeto <- str_extract(edital, regex.objeto)
objeto
[1] "CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS\", \"ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA\", \"CONCESSIONÁRIA MINAS ARENA GESTÃO DE INSTALAÇÕES ESPORTIVAS\", \n\"S"
The result is a character vector, but I would like to have a dataframe, without these symbols \", \
结果是一个字符向量,但我想要一个 dataframe,没有这些符号
\", \
I was thinking the result something like this:我在想结果是这样的:
"CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA"
Thank you all!谢谢你们!
Maybe you can use gsub
to remove double quotes from the string and "\n"
.也许您可以使用
gsub
从字符串和"\n"
中删除双引号。
objeto <- gsub('"|\n|,', '', objeto)
which returns:返回:
objeto
#[1] "CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA CONCESSIONÁRIA MINAS ARENA GESTÃO DE INSTALAÇÕES ESPORTIVAS S"
This can also be written as:这也可以写成:
objeto <- gsub('["\n,]', '', objeto)
Or using str_remove_all
from stringr
library或使用
str_remove_all
库中的stringr
stringr::str_remove_all(objeto, '[\n",]')
which is a shortcut for str_replace_all
这是
str_replace_all
的快捷方式
stringr::str_replace_all(objeto, '[\n",]', '')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.