[英]Encoding problem: Convert bytes to Chinese characters in R
我從 R 中的 html 文件中讀取,其中包含中文字符。 但它顯示了類似的東西
" <td class=\"forumCell\"><a href=\"#\" onClick=\"if(confirm('\xc4\xe3\u0237\xd0\xc5Ҫ\xbbָ\xb4\xb8\xc3\xce\xc4\xd5\xc2\xc2\xf0\xa3\xbf')){location.href='articleBakAdmin.php?action=restore&articleID=120516';}\">\xbbָ\xb4</a></td>"
這是我需要提取的“\\x”字符串。 如何將它們轉換成可讀的漢字?
順便說一句,以某種方式簡單地復制和粘貼上面的 \\x 字符串不會復制問題。
你確定它們都是漢字嗎? 什么是html頁面編碼? 您粘貼的字符串看起來是 hex \\xc4\\xe3
和 unicode chars \ȷ
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.