簡體   English   中英

將帶有制表符和引號作為分隔符的csv文件導入R

[英]Import csv file with both tab and quotes as separators into R

我在csv中有一個帶分隔符的數據集,如下所示。

NO_CAND";"DS_CARGO";"CD_CARGO";"NR_CAND";"SG_UE";"NR_CNPJ";"NR_CNPJ_1";
CLODOALDO JOSÉ DE RAMOS";"Deputado Estadual";"7";"22111";"PB";"08126218000107";"Encargos financeiros e taxas bancárias";

我正在使用帶有選項的read.csv2函數

mydataframe <- read.csv2("filename.csv",header = T, sep=";", quote="\\'", dec=",",
stringsAsFactors=F,  check.names = F, fileEncoding="latin1")      

該代碼讀取數據,但帶有所有引號。

我試圖使用刪除索引

mydataframe[,] <- apply(mydataframe[,], c(1,2), function(x) { 
gsub("\\'", "", x)
})

但這不起作用。

關於如何導入數據以擺脫這些引用的任何想法?

非常感謝。

要刪除引號,請按以下方式使用lapplygsub

mydataframe[] <- lapply(mydataframe, function(x) gsub("\"", "", x))

lapply遍歷數據幀的所有列並返回一個列表; 通過在分配的LHS上使用mydataframe[] ,可以將結果分配回數據框,而不會丟失其屬性(尺寸,名稱等)。 另外,您的數據中沒有任何單引號' ,因此搜索它們不會有任何效果。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM