繁体   English   中英

我可以使用Python和Selenium的正则表达式找到一个元素吗?

[英]Can I find an element using regex with Python and Selenium?

我需要单击下拉列表并单击其中的隐藏元素。 html将由javascript生成,我不会知道id或类名,但我知道它会有一个短语。 我可以通过正则表达式查找和元素然后用硒点击它吗?

您不能简单地使用内置的selenium webdriver定位器进行基于正则表达式的搜索,但是您可以使用多种方法来帮助您:


还有CSS选择器用于元素属性的部分匹配:

a[href*=desiredSubstring]  # contains
a[href^=desiredSubstring]  # starts-with
a[href$=desiredSubstring]  # ends-with

而且你总能找到比需要更多的元素,稍后用Python过滤掉它们,例如:

import re

pattern = re.compile(r"^Some \w+ text.$")

elements = driver.find_elements_by_css_selector("div.some_class")
for element in elements:
    match = pattern.match(element.text)
    if match:
        print(element.text)

您可以使用import re执行正则表达式函数。 下面的代码段会查看表格并在第一个单元格中的<b></b>标记之间抓取文本,如果该行中有3个单元格。

import re
from lxml import html, etree

tree = html.fromstring(browser.page_source)
party_table = tree.xpath("//table")
assert len(party_table) == 1

CURRENT_PARTIES = []
for row in party_table[0].xpath("tbody/tr"):
    cells = row.xpath("td")
    if len(cells) != 3:
        continue

    if cells[1].text == "represented by":
        match = re.search(r'<b>(.+?)</b>', etree.tostring(cells[0]), re.IGNORECASE)
        print "MATCH: ", match

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM