簡體   English   中英

零深度從Java字符串中剝離HTML標簽

[英]Stripping out HTML tags from Java string with zero deps

據我所知,這個問題相似, 這一個和其他人。 我有一個相同的問題( 如何從Java字符串中刪除HTML標記? ), 但又增加了約束,我不想在代碼中添加任何依賴項(Apache Commons,Spring等)。

因此,我正在尋找許多其他框架使用的HTML標記剝離算法的“純Java SE”風格,但不確定從何開始。 提前致謝。

無需顯式使用HTMLEditorKit:

    String html = "<html>...";
    JTextPane pane = new JTextPane();
    pane.setContentType("text/html");
    pane.setText(html);
    StyledDocument doc = pane.getStyledDocument();
    try {
        System.out.println("Text: " + doc.getText(0, doc.getLength()));
    } catch (BadLocationException ex) {
        Logger.getLogger(NewJFrame.class.getName()).log(Level.SEVERE, null, ex);
    }

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM