python: xpath lxml to extract data

Question

<td> <span class="data_lbl updated-daily">P/E Ratio <small class="data_meta">(including extraordinary items)</small></span> <span class="data_data"> <span class="marketDelta deltaType-negative">-69.83</span> </span> </td>

How to extract data PE Ratio data '-69.83' in a robust way? I want to point it straight to the P/E Ratio.

from lxml import html
import requests

StockData =['AASIA']
page_wsj1 = requests.get('http://quotes.wsj.com/MY/'+StockData[x]+'/financials')
wsj1 = html.fromstring(page_wsj1.content)
PE = wsj1.xpath('//td[contains(.,"P/E Ratio")]/text()')

but the result is ['','','','','']

wsj1.xpath('//td[normalize-space(span) = "P/E Ratio"]/span[@class = "data_data"]/span/text()')

also result []

Answer 1

//td[normalize-space(span/text()) = "P/E Ratio"]/span[@class = "data_data"]/span

要么

//td[contains(normalize-space(span), "P/E Ratio")]/span[@class = "data_data"]/span

python: xpath lxml to extract data

Question

1 answers

solution1
0 ACCPTED 2016-11-08 16:02:15

python: xpath lxml to extract data

Question

1 answers

solution1 0 ACCPTED 2016-11-08 16:02:15

solution1
0 ACCPTED 2016-11-08 16:02:15