[英]Java JSoup library element.text() returns ' ' as a #160 ASCII character
最近,我碰到了JSoup庫1.3.3的一種奇怪行為(我知道它很舊)。
解析文本節點時,此conatins
實體,可以通過在此元素上調用.text()將其轉換為#160 ASCII char 。
你有沒有經歷過? 您認為這是正確的行為嗎? (檢查了Jsoup倉庫是否有錯誤,找不到)
謝謝,
一月
非打破空間是不一樣的一個正常的空間。 在ISO-8859-*,Windows-1252中,不間斷空格為0xA0或十進制值為160,在Unicode中為U + 00A0(在UTF-8中,其編碼為0xC2 0xA0)。 因此,根據您的確切編碼,這是正確的行為。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.