[英]Return character parsing KML file
我在解析KML文件時遇到兩個問題。 我正在使用DocumentBuilder來做到這一點。 這是我要解析的示例部分:
<Placemark>
<description><div align=center><img src=some_image.jpg width=300 height=220/><br/>SOME IMAGE</div></description>
<styleUrl>#m_ylw-pushpin</styleUrl>
<ExtendedData>
<Data name="Numero">
<Value>00032</Value>
</Data>
<Data name="Nombre">
<Value>GTA ALONSO MARTINEZ</Value>
</Data>
</ExtendedData>
<Point>
<altitudeMode>relativeToGround</altitudeMode>
<coordinates>-3.69556116887887,40.4276170711932,10 </coordinates>
</Point>
</Placemark>
第一件事是,當我想要獲得“地標”的子元素時,我在標簽之間得到了一些返回字符“ \\ n”。 例如
NodeList nodeList = doc.getElementsByTagName("Placemark");
String node = nodeList.item(0).getTextContent(); // node = "\n"
String node2 = nodeList.item(1).getTextContent(); // node = [content of <description>]
另一個問題是DocumentBuilder是否可以將html字符(<和>)轉換為(<和>)以進入此標記並正確解析。
謝謝
您是否嘗試過像http://code.google.com/p/javaapiforkml/
特別是,這幾乎總是生成或解析KML的答案,尤其是在您不熟悉XML解析,字符集等的情況下。
可以在DocumentBuilderFactory
配置一些選項,例如合並(即,將CDATA元素擴展到文本節點中),忽略注釋等。
在你的情況,如果你只是想不傾倒在純文本空間的內容(制表符,\\ n,空間等)的XML內容,而這些元素間“\\ n”您應該通過true
到setIgnoringElementContentWhitespace()
的方法DocumentBuilderFactory
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.