簡體   English   中英

Python Beautiful Soup Web Scraping?

[英]Python Beautiful Soup Web Scraping?

我利用了漂亮的湯和class_來刮網。 當我使用find時,可以使用get.text()在標記中查找文本。 但是,我想要以下幾個值。

boal_data = boal_soup(class_="investment-info__item grid__item lap--1-2 desk--1-2")
print (boal_data)

然后在打印時會產生以下內容。

[<div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Investment Date</h2>
<p class="fontsize--h3">Apr 2018</p>
</div>, <div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Country</h2>
<p class="fontsize--h3">Netherlands</p>
</div>, <div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Revenue at ACQ.</h2>
<p class="fontsize--h3">€156m</p>
</div>, <div class="investment-info__item grid__item lap--1-2 desk--1-2">
<h2 class="fontsize--p">Employees at ACQ.</h2>
<p class="fontsize--h3">370</p>
</div>]

我希望能夠補充以下內容。

<p class="fontsize--h3">[this text here] </p>

我該怎么做?

使用findfind_all獲取段落標簽的文本。 你可以試試這個

soup.find_all("p","fontsize--h3").getText()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM