[英]How to fix special characters in R? REPLACEMENT CHARACTER
我正在处理的一些数据有问题。 我从 SQL SERVER 中提取数据并使用 RI 处理它们,但是对于某些名称字段,某些名称使用 REPLACEMENT CHARACTER(Unicode 字符“REPLACEMENT CHARACTER”(U+FFFD))而不是字母,是此处输入的图像描述我不想使用替换功能来更改整个名称。 一些想法?
例如名称 MAGAÑA:MAGAÑA
我使用以下代码进行连接和查询:
library(odbc)
library(tidyverse)
library(dgof)
library(pROC)
library(ggplot2)
library(dbplyr)
library(dplyr)
library(lubridate)
library(janitor)
library(DBI)
library(readxl)
library(data.table)
## Connection
conex1 <- dbConnect(odbc(),
Driver = "SQL Server",
Server = "xxx.xxx.xxx.xx",
Database = "xxxxxxxx",
UID = "xxxxxxx",
PWD = "xxxxxxxxx",
Port = 1433)
# Query
Fecha_nac<- dbSendQuery(conex1, "SELECT id_orden,
fecha_nacimiento
FROM zzgm_clientes_xxxxxxx") %>%
dbFetch()
我认为, iconv
可以在这种情况下为您提供帮助。
dataframe_with_right_symbols <- raw_dataframe %>%
mutate_if(is.character, function(col) iconv(col, to="UTF-8"))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.