簡體   English   中英

從xml解析文本

[英]parse text from xml

我有以下鏈接

https://hero.epa.gov/hero/ws/swift.cfc?method=getProjectRIS&project_id=993&getallabstracts=true

我想解析此xml以僅獲取文本,例如

Provider: HERO - 2.xx
DBvendor=EPA
Text-encoding=UTF-8

我該如何解析?

嗯,這不是文本文件,而是HTML文件。 如果您在瀏覽器中打開文件並選擇view source您將能夠看到<char>標記中包含的文本。

在瀏覽器中打開它時,這些標簽和其他HTML內容將被解釋並在頁面上呈現輸出(這就是它看起來像文本的原因)。 如果要在Java中實現類似的行為,則應查看PhantomJS和/或JSoup示例。

它看起來像一個文本文件,但它是一個XML文件,瀏覽器僅顯示其文本內容。 要驗證右鍵單擊並查看頁面源。

您可以使用Jsoup之類的庫來解析文件並獲取內容。

https://jsoup.org/cookbook/introduction/parsing-a-document

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM