尝试使用 BeautifulSoup 在 Python 中获取 span 的内容

Question

from bs4 import BeautifulSoup

url = 'C:\\Users\\Zandrio\\Documents\\Python-Selexion\\HTML-localhost\\Selexion.html'

page = open(url)
soup = BeautifulSoup(page.read(), features="lxml")
prettify = soup.prettify
Model = "".join([div.text for div in soup.find_all('div', {'class' : 'title-options'})])
print(Model)

Output:输出：

PS C:\Users\Zandrio> & C:/Users/Zandrio/AppData/Local/Programs/Python/Python38/python.exe c:/Users/Zandrio/Documents/Requests/selexion.py

                                        SQQE55Q90R

                    Merk:
                    Samsung                  Afdrukken

HTML: HTML：

<div class="title-options">
<span>
 SQQE55Q90R
</span>
<span>
  Merk: Samsung                
</span>
<span class="print"> <a href="/nl/pr/samsung-qled-qe55q90r/product-sheet" class="product-file-pdf" target="_blank" title="Afdrukken">Afdrukken</a>
</span>
</div>

I just want the Model number in this case, that is SQQE55Q90R here.在这种情况下，我只想要型号，这里是 SQQE55Q90R。 Please suggest any solution.请提出任何解决方案。

Answer 1

from bs4 import BeautifulSoup
url = 'C:\\Users\\Zandrio\\Documents\\Python-Selexion\\HTML-localhost\\Selexion.html'

page = open(url)
soup = BeautifulSoup(page.read(), features="lxml")
div = soup.body.find('div', attrs={'class': 'title-options'})
model_number = div.span.text.strip()  # text of first span

print(model_number)

Answer 2

from bs4 import BeautifulSoup

path = 'C:\\Users\\Zandrio\\Documents\\Python-Selexion\\HTML-localhost\\Selexion.html'

with open(path) as f:
    content = f.read()
soup = BeautifulSoup(content, 'html.parser')

divs = soup.find_all('div', {'class':'title-options'})
for div in divs:
    spans = div.find_all('span')
    sp1, sp2, sp3 = spans
    print(sp1.text.strip())
    print(sp1.text.strip())
    print(sp1.text.strip())

尝试使用 BeautifulSoup 在 Python 中获取 span 的内容

问题描述

2 个解决方案

解决方案1
1 已采纳 2020-02-26 05:37:36

解决方案2
0 2020-02-26 05:47:55

尝试使用 BeautifulSoup 在 Python 中获取 span 的内容

问题描述

2 个解决方案

解决方案1 1 已采纳 2020-02-26 05:37:36

解决方案2 0 2020-02-26 05:47:55

解决方案1
1 已采纳 2020-02-26 05:37:36

解决方案2
0 2020-02-26 05:47:55