簡體   English   中英

使用 BS4 抓取網站

[英]Scraping websites with BS4

我有這個代碼

import requests
from bs4 import BeautifulSoup


result = requests.get("http://www.cvbankas.lt/")
src = result.content
soup = BeautifulSoup(src, 'lxml')

urls = []
for article_tag in soup.find_all("article"):
        a_tag = article_tag.find('a')
        urls.append(a_tag.attrs['href'])
        div_tag = article_tag.find('span')
        urls.append(div_tag.attrs['class'])

print(urls)

誰能解釋我如何獲得紅色標記的數據?

網頁源截圖

您可以使用 class label “salary_amount”獲得跨度

salary_object = article_tag.find("span", class_= "salary_amount")

然后提取帶有創建的object的.text屬性的文本。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM