在美丽的汤中找到下一个 div 标签

Question

python 中的美汤问题

我有一个 HTML 之类的

<div class="content">Somedata</div>
<div class="content">Somedata</div>
<div class="content">Qualification</div>
<div class="content">THE DATA I WANT</div>
<div class="content">Somedata</div>
<div class="content">Somedata</div>

相同的 div 标签再次重复

在这种情况下：不，我会或任何唯一标签，都包含 ---only div 标签---

我如何获得资格后的“我想要的数据”文本提前谢谢

Answer 1

txt = '''
<div class="content">Somedata</div>
<div class="content">Somedata</div>
<div class="content">Qualification</div>
<div class="content">THE DATA I WANT</div>
<div class="content">Somedata</div>
<div class="content">Somedata</div>'''

soup = BeautifulSoup(txt, 'html.parser')

print(soup.select_one('div:contains("Qualification") ~ div').text)

印刷：

THE DATA I WANT

或者：

print(soup.find(text="Qualification").find_next().text)

或者：

print(soup.find(lambda t: t.find_previous() and t.find_previous().text == 'Qualification').text)

编辑：要遍历<div> s，您可以使用简单的 for 循环：

for item in souped.find_all(lambda t: t.name == 'div' and t.text == 'Qualification'):
    print(item.find_next().text)

Answer 2

你可以试试：

from bs4 import BeautifulSoup

html_doc ='''<div class="content">Somedata</div>
<div class="content">Somedata</div>
<div class="content">Qualification</div>
<div class="content">THE DATA I WANT</div>
<div class="content">Somedata</div>
<div class="content">Somedata</div>'''

soup = BeautifulSoup(html_doc, 'lxml')

result = soup.find_all("div", class_="content")[3].text

print(result)

Output 将是：

THE DATA I WANT

或者

import re
soup = BeautifulSoup(html_doc, 'lxml')
print(soup.find(text=re.compile('^THE DATA I WANT$')))

或者

print(soup.find(string="Qualification").find_next().text)

在美丽的汤中找到下一个 div 标签

问题描述

2 个解决方案

解决方案1
1 已采纳 2020-06-22 19:48:54

解决方案2
0 2020-06-22 19:49:35

在美丽的汤中找到下一个 div 标签

问题描述

2 个解决方案

解决方案1 1 已采纳 2020-06-22 19:48:54

解决方案2 0 2020-06-22 19:49:35

解决方案1
1 已采纳 2020-06-22 19:48:54

解决方案2
0 2020-06-22 19:49:35