用美汤获取 html 文字

Question

我正在尝试从 div 中获取数字：

<div class="tv-symbol-price-quote__value js-symbol-last">122.7<span class="">8</span></div>

我需要 122.7 号码，但我找不到。 我尝试过：

strings = soup.find("div", class_="tv-symbol-price-quote__value js-symbol-last").string

但是，有不止一个元素，我收到“无”。

有没有办法打印孩子并从孩子那里获取字符串？

Answer 1

使用.getText() 。

例如：

from bs4 import BeautifulSoup

sample_html = """
<div class="tv-symbol-price-quote__value js-symbol-last">122.7<span class="">8</span></div>
"""

soup = BeautifulSoup(sample_html, "html.parser")
strings = soup.find("div", class_="tv-symbol-price-quote__value js-symbol-last").getText()
print(strings)

Output：

122.78

或使用__next__()仅获取122.7 。

soup = BeautifulSoup(sample_html, "html.parser")
strings = soup.find("div", class_="tv-symbol-price-quote__value js-symbol-last").strings.__next__()
print(strings)

Output：

122.7

Answer 2

要仅获取第一个文本，请搜索标签，然后调用next_element方法。

from bs4 import BeautifulSoup


html = """
<div class="tv-symbol-price-quote__value js-symbol-last">122.7<span class="">8</span></div>
"""
soup = BeautifulSoup(html, "html.parser")

print(
    soup.find("div", class_="tv-symbol-price-quote__value js-symbol-last").next_element
)

Output：

122.7

Answer 3

您可以使用 selenium 查找元素，然后使用 BS4 解析它。 一个例子是

import selenium.webdriver as WD
from selenium.webdrive.chrome.options import Options
import bs4 as B

driver = WD.Chrome()

objXpath = driver.find_element_by_xpath("""yourelementxpath""")
objHtml = objXpath.get_attribute("outerHTML")
soup = B.BeutifulSoup(objHtml, 'html.parser')
text = soup.get_text()

这段代码应该可以工作。
免责声明
我有一段时间没有使用 selenium 和 bs4 完成工作，所以你可能需要稍微调整一下。

用美汤获取 html 文字

问题描述

3 个解决方案

解决方案1
1 已采纳 2021-03-17 16:25:08

解决方案2
1 2021-03-17 16:34:28

解决方案3
1 2021-03-17 17:08:09

用美汤获取 html 文字

问题描述

3 个解决方案

解决方案1 1 已采纳 2021-03-17 16:25:08

解决方案2 1 2021-03-17 16:34:28

解决方案3 1 2021-03-17 17:08:09

解决方案1
1 已采纳 2021-03-17 16:25:08

解决方案2
1 2021-03-17 16:34:28

解决方案3
1 2021-03-17 17:08:09