[英]How to fix special characters in R? REPLACEMENT CHARACTER
我正在處理的一些數據有問題。 我從 SQL SERVER 中提取數據並使用 RI 處理它們,但是對於某些名稱字段,某些名稱使用 REPLACEMENT CHARACTER(Unicode 字符“REPLACEMENT CHARACTER”(U+FFFD))而不是字母,是此處輸入的圖像描述我不想使用替換功能來更改整個名稱。 一些想法?
例如名稱 MAGAÑA:MAGAÑA
我使用以下代碼進行連接和查詢:
library(odbc)
library(tidyverse)
library(dgof)
library(pROC)
library(ggplot2)
library(dbplyr)
library(dplyr)
library(lubridate)
library(janitor)
library(DBI)
library(readxl)
library(data.table)
## Connection
conex1 <- dbConnect(odbc(),
Driver = "SQL Server",
Server = "xxx.xxx.xxx.xx",
Database = "xxxxxxxx",
UID = "xxxxxxx",
PWD = "xxxxxxxxx",
Port = 1433)
# Query
Fecha_nac<- dbSendQuery(conex1, "SELECT id_orden,
fecha_nacimiento
FROM zzgm_clientes_xxxxxxx") %>%
dbFetch()
我認為, iconv
可以在這種情況下為您提供幫助。
dataframe_with_right_symbols <- raw_dataframe %>%
mutate_if(is.character, function(col) iconv(col, to="UTF-8"))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.