[英]Exporting Chinese characters from Excel to R
我在Excel中有一個文件,該文件的一欄包含中文簡體字。 當我從相應的CSV文件在R中打開它時,只會得到?。
恐怕問題是從Excel導出到CSV時,因為在文本編輯器中打開CSV文件時,我也會得到?。
我該如何解決?
保護中文/ Unicode字符的最佳方法是從.xlsx
讀取文件:
library(readxl)
read_xlsx("yourfilepath.xlsx", col_types = "text")
如果您的文件太大而無法從.xlsx
讀取,則最好的方法是打開Excel並手動將其拆分為多個文件。 (我使用8GB RAM的筆記本電腦的經驗是將文件分成250,000行x 106列。)
如果您需要讀取.csv
,則所有Windows設置/本地化都必須與您的文件相同,但是即使那樣也不能保證所有Unicode字符(例如,表情符號)的完整性。
(如果您還需要.csv
進行其他操作,則在將.xlsx
數據讀取到R
之后,可以使用R
函數write.csv
。)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.