在 str_extract() 之后将字符向量转换为 data.frame

Question

I have a dataframe:我有一个 dataframe：

head(objeto)
                                                      Edital
1                          GOVERNO DO ESTADO DE MINAS GERAIS
2 SECRETARIA-GERAL DA GOVERNADORIA DO ESTADO DE MINAS GERAIS
3                         EDITAL DA CONCORRÊNCIA Nº 001/2012
4                                        EDITAL DE LICITAÇÃO
5                                  CONCORRÊNCIA Nº. 001/2012
6                                      TIPO: TÉCNICA E PREÇO

I want to find the regex "Objeto" in it, so:我想在其中找到正则表达式“Objeto”，所以：

regex.objeto <- "(?<=Objeto: )([^.]+)"
objeto <- str_extract(edital, regex.objeto)

objeto

[1] "CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS\", \"ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA\", \"CONCESSIONÁRIA MINAS ARENA GESTÃO DE INSTALAÇÕES ESPORTIVAS\", \n\"S"

The result is a character vector, but I would like to have a dataframe, without these symbols \", \结果是一个字符向量，但我想要一个 dataframe，没有这些符号\", \

I was thinking the result something like this:我在想结果是这样的：

"CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA"

Thank you all!谢谢你们！

Answer 1

Maybe you can use gsub to remove double quotes from the string and "\n" .也许您可以使用gsub从字符串和"\n"中删除双引号。

objeto <- gsub('"|\n|,', '', objeto)

which returns:返回：

objeto
#[1] "CONTRATAÇÃO DE EMPRESA PARA A PRESTAÇÃO DE SERVIÇOS ESPECIALIZADOS DE AFERIÇÃO DO DESEMPENHO E DA QUALIDADE DA CONCESSIONÁRIA MINAS ARENA GESTÃO DE INSTALAÇÕES ESPORTIVAS S"

This can also be written as:这也可以写成：

objeto <- gsub('["\n,]', '', objeto)

Or using str_remove_all from stringr library或使用str_remove_all库中的stringr

stringr::str_remove_all(objeto, '[\n",]')

which is a shortcut for str_replace_all这是str_replace_all的快捷方式

stringr::str_replace_all(objeto, '[\n",]', '')

在 str_extract() 之后将字符向量转换为 data.frame

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-05-22 00:52:14

在 str_extract() 之后将字符向量转换为 data.frame

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-05-22 00:52:14

解决方案1
1 已采纳 2020-05-22 00:52:14