[英]Is there any way to access <option> text when parsing forms using lxml.html?
我正在嘗試解析如下所示的html表單:
<select name="country">
<option value="1">Afghanistan</option>
<option value="2">Albania</option>
<option value="3">Algeria</option>
<option value="4">Andorra</option>
....
</select>
使用lxml.html.parse解析文檔之后,可以使用以下方法訪問值列表:
doc.forms[0].elements["country"].value_options
但是,這將返回原始值的列表(['1','2','3','4'...]),而沒有相應的國家/地區名稱。 是否有一種簡單的方法來獲取選項標簽的內容,包括文本和值?
我使用xpath通過html ...嘗試:
options = doc.xpath("//select[@name='country']/option")
option_text = [option.text for option in options]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.