簡體   English   中英

編碼問題:在R中將字節轉換為漢字

[英]Encoding problem: Convert bytes to Chinese characters in R

我從 R 中的 html 文件中讀取,其中包含中文字符。 但它顯示了類似的東西

"    <td class=\"forumCell\"><a href=\"#\" onClick=\"if(confirm('\xc4\xe3\u0237\xd0\xc5Ҫ\xbbָ\xb4\xb8\xc3\xce\xc4\xd5\xc2\xc2\xf0\xa3\xbf')){location.href='articleBakAdmin.php?action=restore&articleID=120516';}\">\xbbָ\xb4</a></td>"

這是我需要提取的“\\x”字符串。 如何將它們轉換成可讀的漢字?

順便說一句,以某種方式簡單地復制和粘貼上面的 \\x 字符串不會復制問題。

你確定它們都是漢字嗎? 什么是html頁面編碼? 您粘貼的字符串看起來是 hex \\xc4\\xe3和 unicode chars

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM