簡體   English   中英

RSS 提要替換編碼字符

[英]RSS feed replace encoded characters

我正在處理來自一些 RSS 提要的新聞文章,並希望在基於 Java 的 web 應用程序上顯示標題。

一些提要在標題中包含編碼字符,例如

阿森納的維多利亞之行“更難” 測試而不是扭轉歐洲聯賽的領帶,警告東道主教練

可能還有其他編碼字符。 使用 Java(並且無需定義要搜索/替換的字符)如何替換所有編碼字符,以便可以在網站上正確顯示標題。 例如

東道主教練警告說,阿森納的維多利亞之行是一場比逆轉歐聯杯更難的考驗

Apache Commons Lang對此提供支持(org.apache.commons:commons-lang3:3.9):

跑步:

import org.apache.commons.lang.StringEscapeUtils;

public class Escape {

    public static void main(String[] args) {
        System.out.println(StringEscapeUtils.unescapeXml("Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach"));
    }
}

按預期給出:

東道主教練警告說,阿森納的維多利亞之行是一場比逆轉歐洲聯賽更難的考驗

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM