繁体   English   中英

Python 通过 Xpath 获得 html 元素

[英]Python get html element by Xpath

我尝试通过 XPath 获取 HTML 元素,我尝试过这种方式,但它总是返回一个空字符串。 谁能告诉我,我如何通过 X-Path 获取元素?

    for x in list_href_einrichtungen:

      url = 'https://pflegefinder.bkk-dachverband.de/' + x
      source_code = requests.get(url)
      plain_text = source_code.text
      soup = BeautifulSoup(plain_text)

      **doc = lxml.html.fromstring(source_code.content)
      strasse = doc.xpath('div[3]/div[3]/table[1]/tbody/tr/td/div/div/div[1]/p[1]/text()[1]')**

      name = soup.find('h2').text
      uebergabeeinrichtung = Einrichtung("IK", name, 'Teststraße', '12345', 'Ort', "telefon", 
      'Telefax', 'email','internet')

      list_einrichtungen.append(uebergabeeinrichtung)
      print(name,  strasse)

在此处输入图像描述

Sie können kein 元素 mit Beautifulsoup mit XPATH finden。 Eine andere 图书馆,die Sie benutzten können heisst 'lxml'。 Das steht hier 在 StackOverflow 中。 作为贝斯皮尔:

from urllib.request import urlopen
from lxml import etree

url =  "http://www.example.com/servlet/av/ResultTemplate=AVResult.html"
response = urlopen(url)
htmlparser = etree.HTMLParser()
tree = etree.parse(response, htmlparser)
tree.xpath(xpathselector)

Ich hoffe, dass das geholfen hat!

PD:对不起,德语,ich lerne gerade;)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM