[英]How to read a .csv file with more than one language in R?
我想读取 R 中的 a.csv 文件。
但是,.csv 文件包含来自多种语言的单词(特定字母)。 例如,德语、波兰语和希腊语。
.csv 文件的一些行如下:
1 Zürich
2 Östra Mellansverige
3 Åland
4 Stredné Slovensko
5 Małopolskie
6 Ελλάδα
前 4 行可使用以下命令读取:
Sys.setlocale(category = "LC_ALL", locale = "german")
第 5 行可使用以下命令读取:
Sys.setlocale(category = "LC_ALL", locale = "polish")
但是,最后一行不可读:
Sys.setlocale(category = "LC_ALL", locale = "greek")
我怎样才能阅读包含所有必要语言的所有 6 行?
请注意,我使用以下内容来读取 .csv 文件:
read.csv("file_name.csv",header=TRUE,sep=";",na.strings = "",encoding="UTF-8")
使用read.csv
加载数据时,文本的语言无关紧要。 这里没有语义或语法,只有单个字符的编码。 UTF-8 包含来自世界上几乎所有语言的字符和符号,因此如果文件最初是用 UTF-8 编码编写的,您可以随时使用它。 Function Sys.setlocale
主要用于格式化小数点与逗号或设置时区。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.