簡體 English 中英

如何從 Java 中的 xml 文件中提取大量字符

[英]How to extract a big list of characters from xml file in Java

原文 2011-07-19 23:48:33 7 4 java/ xml/ search/ xpath/ extract

我有一個大的 xml 文件，我不想解析它，我只想存儲<information>...</information>之間的每個字符，它們是 xml 文件中的標簽。

我怎樣才能做到這一點？

4 個解決方案

如果問題是您嘗試提取的數據適合 memory，但整個 XML 文件不適合，則使用流式解析器，例如XPP 。

如果不解析文件，您將無法准確找到<information>元素中的字符。 你可以做一些在 99% 的時間里都有效的事情，但是當有人做了你沒想到的事情時它會中斷，比如在開始標簽中放置空格，或者有一個注釋掉的<information>元素，或者把部分外部實體中的<information>元素。

硬着頭皮。 如果是 XML，則需要 XML 解析器來讀取它。

您可能想解釋為什么您不想解析它，因為這將有助於建議其他解決方案。

話雖如此，如果您可以為該節點構建 XPath，您始終可以使用 XPath 獲取該信息。 請參閱本教程。

更新

鑒於新信息，這不是您想要的解決方案。 如果您想將 xml 視為字符串，則將其讀入 StringBuilder（StringBuffer 的更快、線程不安全的版本）是您最好的選擇。 如果您在使用 StringBuffer 時遇到問題，請發布您嘗試過的代碼和錯誤消息。 它的最大尺寸是java.lang.Integer.MAX_VALUE ，即 2147483647。

考慮到您不想使用解析器並且只想提取兩個標簽之間的所有字符，我寧願建議您將 xml 內容提取為字符串，並使用簡單的正則表達式匹配來提取兩個標簽。

如何從xml文件中提取字符串列表？

[英]How to extract a list of string from xml file?

從大型xml文件中提取大xml塊的最佳方法

[英]Best way to extract big xml block from large xml file

如何從Java的XML文件中讀取\\ n之類的特殊字符？

[英]How to read special characters like \n from XML file in Java?

使用Java從xml文件中提取值

[英]Extract values from xml file using Java

解析一個大的xml文件Java

[英]Parsing a big xml file Java

Java或Python根據子文本節點從大XML中提取子XML的方法

[英]Java or Python way to extract a sub-XML from big XML depending on child text nodes

如何從java中的xml中提取某些塊？

[英]How to extract certain blocks from xml in java?

從Java中的OPML文件提取提要列表

[英]Extract feeds list from an OPML file in java

如何從xml文件反序列化到Java中的對象列表？

[英]How to deserialize from xml file to object list in java?

如何從Java中的對象列表創建XML文件？

[英]How to create XML file from a list of objects in Java?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何從xml文件中提取字符串列表？從大型xml文件中提取大xml塊的最佳方法如何從Java的XML文件中讀取\\ n之類的特殊字符？使用Java從xml文件中提取值解析一個大的xml文件Java Java或Python根據子文本節點從大XML中提取子XML的方法如何從java中的xml中提取某些塊？從Java中的OPML文件提取提要列表如何從xml文件反序列化到Java中的對象列表？如何從Java中的對象列表創建XML文件？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM