在美麗的湯中找到下一個 div 標簽

Question

python 中的美湯問題

我有一個 HTML 之類的

<div class="content">Somedata</div>
<div class="content">Somedata</div>
<div class="content">Qualification</div>
<div class="content">THE DATA I WANT</div>
<div class="content">Somedata</div>
<div class="content">Somedata</div>

相同的 div 標簽再次重復

在這種情況下：不，我會或任何唯一標簽，都包含 ---only div 標簽---

我如何獲得資格后的“我想要的數據”文本提前謝謝

Answer 1

txt = '''
<div class="content">Somedata</div>
<div class="content">Somedata</div>
<div class="content">Qualification</div>
<div class="content">THE DATA I WANT</div>
<div class="content">Somedata</div>
<div class="content">Somedata</div>'''

soup = BeautifulSoup(txt, 'html.parser')

print(soup.select_one('div:contains("Qualification") ~ div').text)

印刷：

THE DATA I WANT

或者：

print(soup.find(text="Qualification").find_next().text)

或者：

print(soup.find(lambda t: t.find_previous() and t.find_previous().text == 'Qualification').text)

編輯：要遍歷<div> s，您可以使用簡單的 for 循環：

for item in souped.find_all(lambda t: t.name == 'div' and t.text == 'Qualification'):
    print(item.find_next().text)

Answer 2

你可以試試：

from bs4 import BeautifulSoup

html_doc ='''<div class="content">Somedata</div>
<div class="content">Somedata</div>
<div class="content">Qualification</div>
<div class="content">THE DATA I WANT</div>
<div class="content">Somedata</div>
<div class="content">Somedata</div>'''

soup = BeautifulSoup(html_doc, 'lxml')

result = soup.find_all("div", class_="content")[3].text

print(result)

Output 將是：

THE DATA I WANT

或者

import re
soup = BeautifulSoup(html_doc, 'lxml')
print(soup.find(text=re.compile('^THE DATA I WANT$')))

或者

print(soup.find(string="Qualification").find_next().text)

在美麗的湯中找到下一個 div 標簽

問題描述

2 個解決方案

解決方案1
1 已采納 2020-06-22 19:48:54

解決方案2
0 2020-06-22 19:49:35

在美麗的湯中找到下一個 div 標簽

問題描述

2 個解決方案

解決方案1 1 已采納 2020-06-22 19:48:54

解決方案2 0 2020-06-22 19:49:35

解決方案1
1 已采納 2020-06-22 19:48:54

解決方案2
0 2020-06-22 19:49:35