繁体 English 中英

Python：使用lxml定位跨度之外的文本

[英]Python: Using lxml to locate text outside a span

原文 2012-07-23 18:26:48 6 1 python/ css-selectors/ lxml

我必须解析一些HTML。 但是，它格式不正确..因为您可以看到文本“Cowabunga”不包含在任何HTML元素中。

from lxml.html import fromstring
from lxml.cssselect import CSSSelector

stuff = '''<p>
                <span id="alpha" style="color: #999; "></span> 
                <span id="bravo" style="color: #999; "></span> 
                Cowabunga  
            </p>'''

l = CSSSelector ("p")

e = l(fromstring(stuff))
print e[0].text

如何使用lxml / Python编写CSSSelector来查找此文本？

谢谢

编辑：上面的代码给出了空白输出 - 只是一行空格 - 我需要抓住“Cowabunga”

1 个解决方案

这是混合内容所以它总是有点粗糙。 e[0].text_content()将获取示例中的所有文本。

使用 Python XPath lxml package 刮掉<span>标签</span>中的文字

[英]Using Python XPath lxml package to scrape text in <span> tag

使用lxml从范围中提取文本？

[英]Extracting text from a span with lxml?

python：使用lxml xpath从更改span类中获取数据

[英]python: get data from changing span class using lxml xpath

使用python lxml循环问题进行文本提取

[英]text extraction using python lxml looping issue

使用 python 和正则表达式 BeautifulSoup lxml 查找文本

[英]Find with text using python and regex BeautifulSoup lxml

无法使用 Python Selenium 在 span 类中定位元素

[英]Unable to locate an element in a span class using Python Selenium

python xpath根据跨度文本提取标签外部的文本

[英]python xpath extract text outside tag based on the span text

Python BeautifulSoup 如何定位跨度？

[英]Python BeautifulSoup How To Locate Span?

无法通过 python 找到跨度 class

[英]Unable to locate a span class by python

python lxml xtree没有从span中获取数字

[英]python lxml xtree not getting number from span

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用 Python XPath lxml package 刮掉<span>标签</span>中的文字使用lxml从范围中提取文本？ python：使用lxml xpath从更改span类中获取数据使用python lxml循环问题进行文本提取使用 python 和正则表达式 BeautifulSoup lxml 查找文本无法使用 Python Selenium 在 span 类中定位元素 python xpath根据跨度文本提取标签外部的文本 Python BeautifulSoup 如何定位跨度？无法通过 python 找到跨度 class python lxml xtree没有从span中获取数字

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM