簡體   English   中英

WebHarvest XML格式不正確

[英]WebHarvest XML not well formed

我正在使用WebHarvest嘗試從Woot.com接收數據,但遇到了一些不同的錯誤。 我可以通過第一個過程獲取網站,但是當我嘗試在變量窗口中測試xpath時,出現錯誤org.xml.sax.SAXParseException;。 lineNumber:86; columnNumber:99; 對實體“ pt2”的引用必須以“;”結尾 定界符 如果嘗試使用漂亮的打印功能,則返回的XML格式不正確:對實體“ pt2”的引用必須以“;”結尾 定界符。 {line:86,col:99]。 最后,在我正在編寫的腳本內部,如果我在xpath標記中添加一個表達式,則得到的元素類型“ xpath”必須后跟attributespecification,“>”或“ />”。 有人可以告訴我我在做什么錯嗎? 我對WebHarvest還是很陌生,對這種程序沒有任何經驗。

我的代碼是:

<?xml version="1.0" encoding="UTF-8"?><config>
<xpath expression="(//div[@class="overview"])[1]//h2/text()">
<html-to-xml>
<http url="http://www.woot.com/"/>
</html-to-xml>
</xpath>
</config>

為了使XML格式正確,您可以使用&apos; 而不是&quot; 在屬性expression 結果如下:

<?xml version="1.0" encoding="UTF-8"?><config>
<xpath expression="(//div[@class='overview'])[1]//h2/text()">
<html-to-xml>
<http url="http://www.woot.com/"/>
</html-to-xml>
</xpath>
</config>

您可以使用&apos; &quot; 包裝一個屬性。 但是,無論如何都不能嵌套它。 以下是一些示例:

 <xpath expression='(//div[@class="overview"])[1]//h2/text()'>           --- valid
 <xpath expression='(//div[@class='overview'])[1]//h2/text()'>           --- invalid
 <xpath expression="(//div[@class="overview"])[1]//h2/text()">           --- invalid
 <xpath expression='(//div[@class=&apos;overview&apos;])[1]//h2/text()'> --- valid
 <xpath expression="(//div[@class=&apos;overview&apos;])[1]//h2/text()"> --- valid
 <xpath expression="(//div[@class=&quot;overview&quot;])[1]//h2/text()"> --- valid

希望這可以幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM