簡體   English   中英

我無法從該網站上抓取項目。 Python

[英]I can not scrape item from this website. Python

我試圖刮掉這個網站上的所有服裝,但我做不到。 我在 'find_all' 中設置了 'limit=3' 但它只給了我 1 個結果。 如何在一個請求中獲得所有結果? 請幫幫我,我被這個困住了!

這是我要抓取的電子商務網站

def trendyol():
url = "https://www.trendyol.com/erkek+kazak--hirka?filtreler=22|175"
headers = {"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'}

page = requests.get(url, headers=headers).text
soup = BeautifulSoup(page, "html.parser")


list= soup.find_all("div",{"class":"p-card-chldrn-cntnr"}, limit=3)
    
for div in list:
        
    link= str("https://www.trendyol.com/" + div.a.get("href"))
        
    name = div.find("span",{"class":"prdct-desc-cntnr-name hasRatings"}).text
 

print(f'link: {link}')
print(f'isim: {name}')
  

試試這個代碼:

from bs4 import BeautifulSoup
import requests

def trendyol(url):
    headers = {"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'}
    page = requests.get(url, headers=headers).text
    soup = BeautifulSoup(page, "html.parser")

    list= soup.find("div", {'class':'prdct-cntnr-wrppr'})
    for link in list.find_all('div',{'class': 'p-card-chldrn-cntnr'}):
        print("https://www.trendyol.com" + link.find('a', href=True)['href'])
        print(link.find('div',{'class':'image-container'}).img['alt'])
        print(link.find('span',{'class':'prdct-desc-cntnr-ttl'}).text)

url = "https://www.trendyol.com/erkek+kazak--hirka?filtreler=22%7C175&pi=3"
trendyol(url)

此代碼帶有印刷產品 url、標題和標題的替代文本。 謝謝。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM