繁体   English   中英

从xml解析文本

[英]parse text from xml

我有以下链接

https://hero.epa.gov/hero/ws/swift.cfc?method=getProjectRIS&project_id=993&getallabstracts=true

我想解析此xml以仅获取文本,例如

Provider: HERO - 2.xx
DBvendor=EPA
Text-encoding=UTF-8

我该如何解析?

嗯,这不是文本文件,而是HTML文件。 如果您在浏览器中打开文件并选择view source您将能够看到<char>标记中包含的文本。

在浏览器中打开它时,这些标签和其他HTML内容将被解释并在页面上呈现输出(这就是它看起来像文本的原因)。 如果要在Java中实现类似的行为,则应查看PhantomJS和/或JSoup示例。

它看起来像一个文本文件,但它是一个XML文件,浏览器仅显示其文本内容。 要验证右键单击并查看页面源。

您可以使用Jsoup之类的库来解析文件并获取内容。

https://jsoup.org/cookbook/introduction/parsing-a-document

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM