簡體   English   中英

使用 SGML 解析 Java 字符串

[英]Parsing Java String with SGML

我有一個帶有 SGML 的 Java 字符串,就像這樣......

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>

我如何解析它以獲取例如<suggestion> </suggestion>的文本,以便“鴨子”出來?

javax.swing.text.html.parser.Parse 會有什么幫助嗎? 或者我只能用它解析 HTML 文檔?

您顯示的字符串不是 HTML,但可以由XML 解析器解析

SAX API是 JDK 和 AFAIK 的一部分,大多數 XML 解析器都實現了它。

嘗試使用 html 解析器,它們(根據需要)對格式錯誤的標記非常寬容,而 html 本質上是基於 SGML 的。

例如http://htmlparser.sourceforge.net/

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM