簡體   English   中英

使用lxml從HTML解析段落

[英]Parse paragraphs from HTML using lxml

我是lxml的新手,想從給定的URL中提取<p>PARAGRAPHS</p><li>PARAGRAPHS</li> ,並將其用於進一步的步驟。

我遵循了一個帖子中的示例,並嘗試了以下代碼,但沒有成功:

html = lxml.html('http://www.google.com/intl/en/about/corporate/index.html')
url = 'http://www.google.com/intl/en/about/corporate/index.html'
print html.parse.xpath('//p/text()')

我試圖查看lxml.html中的示例,但沒有找到使用url的任何示例。

您能給我些什么建議嗎? 謝謝。

import lxml.html

htmltree = lxml.html.parse('http://www.google.com/intl/en/about/corporate/index.html')

print htmltree.xpath('//p/text()')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM