繁体   English   中英

在Java中使用正则表达式提取xml标记的内容

[英]Using Regular expressions in java to extract contents of xml tag

我有一个很大的字符串,其中一部分包含以下内容:

<df>asdffs</df><titletext xml:lang="eng" original="y">Dose intensity <inf>low</inf> in advanced cancer: Have we answered the question?</titletext><sdf>gfdgas</sdf>

我需要查找<titletext>标记中是否存在<inf> <titletext>标记。 我正在用Java编写它。

提前致谢。

我强烈建议您使用XML解析器( SAX ,因为您的文档据称很大-它不会一次将所有文档加载到内存中,而是将其流式传输通过)并以此方式进行解析。 您将避免使用正则表达式处理程序无法处理的各种极端情况(因为XML不是常规的

在上面的示例中,您可能应该维护一堆遇到的XML元素,并跟踪<inf>是否以<titletext>

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM