cost 237 ms
為簡體中文標識符構建令牌

[英]Build a token for Simplified Chinese Identifiers

我正在嘗試為簡體中文標識符構建一個令牌。 簡體中文標識符在規范中定義如下: 這是UNICODE-BESTFIT和Windows Codepage 936 。 例如,我所做的是在頁面中查找%xA3C1 ,然后取其對應的代碼,即0xff21 。 因此,我找到了%xA3C1 、 %xA3DA 、 %xA ...

在 colab 中解碼 gb-2312 文件

[英]Decoding gb-2312 file in colab

我正在嘗試在 Colab 中打開一個使用 gb-2312 編碼的文件。 這是我在 IDE 中成功運行以讀取和解碼的代碼: 當我在 colab 中運行此代碼時,我收到以下錯誤: 但是如果不先使用 read() 或 list() 就無法解碼,否則會出現以下錯誤: 這似乎是第 22 條規則。 這是 Col ...

將 GB2312 編碼的 MIME 轉換為可讀字符串

[英]Converting GB2312 Encoded MIME to Readable String

當我問這個問題時,我為聽起來很無知而提前道歉,但我不太擅長概念化編碼和解碼數據的概念。 例如,我可以訪問具有以下值的 MIME 編碼文本: 我知道(或者很確定我知道)它是使用 GB2312 編碼的。 使用在線解碼器翻譯告訴我它是英文中的“sheet”一詞。 有沒有辦法將其解碼成甚至它的源語言字符,我 ...

聲明中帶有 ISO-8859-1 的 GB2312 的 Java XML 編碼

[英]Java XML Encoding for GB2312 with ISO-8859-1 on the declaration

我正在努力將創建 XML 的代碼從 Java 1.4 遷移到 1.8。 從舊的java代碼中,它將xml文件編碼為GB2312,XML聲明是這個<?xml version="1.0" encoding="ISO-8859-1"?>,帶有正確的中文字符。 但是當我轉移到 java 1.8 ...

在MacOS上使用RapidJSON開發QT應用程序時如何獲得正確的中文?

[英]how get correct Chinese when use rapidjson on macos develop qt app?

我在macOS和Windows上開發了一個跨平台的qt應用程序,我有一個名為“ proj.json”的文件,它是由Windows上的我的應用程序中的Rapidjson生成的,在Windows上其編碼格式為GB2312,現在我在我的操作系統中使用了Rapidjson在Mac上的app來分析proj ...

從html下載中文表后的奇怪字符

[英]Strange Characters after downloading Chinese table from html

我正在使用MAC OS X 10.12系統。 我從http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2011/51/06/81/510681114.html下載了表格。 該表是使用GB2312編碼的,但是,我使用GBK來保存該表。 該代碼的主 ...

如何使用Swift 3.0讀取GB2312編碼的文本文件

[英]How to read GB2312 encoded text files using Swift 3.0

我的應用程序需要讀取以GB2312編碼的文本文件。 這是當前代碼。 它引發異常。 無法打開,因為無法確定其內容的文本編碼。 在查看String.Encoding值時,沒有GB2312。 讀取GB2312文本文件的最佳方法是什么? 謝謝雷 ...

有沒有辦法在utf-8和普通字符串獨立平台之間進行轉換?

[英]Is there any way to do convert between utf-8 and plain string platform-independent?

這里的plain string有一種編碼方式: 一個普通的字符串文字,例如"plainstring"編碼為; 所有標准庫都返回或接受。 例如: 據我所知,我的sysytem(windows 10 x64)使用GB2312編碼這樣的普通字符串。 但是如何以平台 ...

為什么 ISO 2022 定義了 94- 和 96-?

[英]Why ISO 2022 defined 94- and 96-?

我對標准 ISO 2022 有一些疑問: 使用 94-(0x21 - 0xFE) 和使用 96-(0x20 - 0xFF) 有什么區別? 為什么,例如在 EUC-CN 中,CS1 中的代碼僅使用有限區域(94-96-)? 為什么不占全部? 出於兼容性或其他原因? 期待您的回復和謝謝~ ...

swift removePercentEncoding 不適用於 gb2312 字符串

[英]swift removingPercentEncoding not work with a gb2312 string

服務器返回一個經過 urlencode 函數處理的 gb2312 字符串: %D7%CF%BD%FB%B3%C7%C4%A7%D6%E4_%CE%DE%CF%DE%D0%A1%CB%B5%CD%F8_www.55x.cn.rar 如何將其解碼回 gb2312 字符串: 紫禁城魔咒_無 ...

如何在C中將UNICODE / UTF-8轉換為GB2312

[英]How to convert UNICODE / UTF-8 to GB2312 in C

我正在尋找一種將兩字節的UNICODE 或變量(1-3字節)的UTF-8字符串轉換為簡體中文(GB2312)的方法。 我發現了許多用於php,Java,C#和Windows的方法,但沒有用於標准“ C”的方法。 現在,我最好的解決方案是翻譯此JavaScript示例: https : / ...

u'囧'.encode('gb2312') 拋出 UnicodeEncodeError

[英]u'囧'.encode('gb2312') throws UnicodeEncodeError

Firefox 可以在 gb2312 編碼的 HTML 中顯示'囧' 。 但是u'囧'.encode('gb2312')拋出UnicodeEncodeError 。 1.有沒有地圖,所以firefox可以在那個地圖中查找gb2312編碼的字符,找到01顯示矩陣並顯示囧。 2.有沒有地圖可以 ...

Python:gb2312編解碼器無法解碼字節

[英]Python: gb2312 codec can't decode bytes

我收到的郵件中有一個單詞編碼的字符串。 在Python3中解析編碼的單詞時,出現異常 'gb2312'編解碼器無法解碼位置18-19中的字節:非法的多字節序列 從make_header方法引發。 在在線工具中解析編碼的字符串可以正常工作( http://dogmami ...

為什么我不能將文件另存為utf-8格式

[英]why can't I save my file as utf-8 format

我想將字符串保存到新的txt文件中。 字符串的編碼為“ utf-8”(我認為是這樣),並且包含一些漢字 但是文件是GB2312 這是我的代碼,我省略了一些: 有時會出現UnicodeEncodeError: ...

C#將中文簡化為十六進制GB2312編碼

[英]Chinese Simplified to Hex GB2312 encoding in C#

我在嘗試將包含簡體中文的字符串轉換為雙字節編碼(GB2312)時遇到問題。 這是用於將中文字符打印到斑馬打印機上的。 我正在查看的規范顯示了一個帶有“岡區色呆”文本的示例,它們顯示為轉換為十六進制值38_54_47_78_49_2b_34_74。 在我的C#代碼中,我嘗試使用下面的 ...

在Java中將utf8轉換為gb2312

[英]Converting utf8 to gb2312 in java

只看下面的代碼 打印錯誤! 我在jdk7和jdk8下都運行此代碼,而我的IDE的代碼樣式是utf8。 誰能幫我? ...

EUC-JP或GB18030文本文件

[英]EUC-JP or GB18030 Text File

我有一個包含以下內容的文本文件: Ã(195) Ü(220) Â(195) ë(235) Ó(211) Ã(195) »(187) §(167) Ã(195) û(251) Ã(195) Ü(220) Â(194) ë(235) Ã(195) û(251) ³(179) Æ(198) Ã(195 ...

在TCPDF和FPDI中使用中文字體。 編碼問題

[英]Using Chinese fonts in TCPDF and FPDI. Encoding problems

我正在編寫一個生成漢字工作表的腳本(以便學生可以生成和練習寫作) 該腳本從index.php中的表單傳遞了15個字符串。 然后將字符串分解為15個元素的數組(每個元素為一個漢字)。 當我想使用Write()函數用這些字符填充文件時,就會出現問題,我已經使用輸入來選擇合適的圖像而沒有任何 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM