![](/img/trans.png)
[英]R Reading a badly formatted csv with uneven quotes and separators in fields
[英]Import csv file with both tab and quotes as separators into R
我在csv中有一個帶分隔符的數據集,如下所示。
NO_CAND";"DS_CARGO";"CD_CARGO";"NR_CAND";"SG_UE";"NR_CNPJ";"NR_CNPJ_1";
CLODOALDO JOSÉ DE RAMOS";"Deputado Estadual";"7";"22111";"PB";"08126218000107";"Encargos financeiros e taxas bancárias";
我正在使用帶有選項的read.csv2函數
mydataframe <- read.csv2("filename.csv",header = T, sep=";", quote="\\'", dec=",",
stringsAsFactors=F, check.names = F, fileEncoding="latin1")
該代碼讀取數據,但帶有所有引號。
我試圖使用刪除索引
mydataframe[,] <- apply(mydataframe[,], c(1,2), function(x) {
gsub("\\'", "", x)
})
但這不起作用。
關於如何導入數據以擺脫這些引用的任何想法?
非常感謝。
要刪除引號,請按以下方式使用lapply
和gsub
。
mydataframe[] <- lapply(mydataframe, function(x) gsub("\"", "", x))
lapply
遍歷數據幀的所有列並返回一個列表; 通過在分配的LHS上使用mydataframe[]
,可以將結果分配回數據框,而不會丟失其屬性(尺寸,名稱等)。 另外,您的數據中沒有任何單引號'
,因此搜索它們不會有任何效果。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.