我在使用 beautifulsoup 進行 web 抓取時遇到了一些問題

Question

當我嘗試使用 .text() 在標簽之間提取文本時，它會給出一個空白屏幕，其中只有 [] 作為 output

import requests
from bs4 import BeautifulSoup

page = requests.get("https://www.amazon.in/s?k=ssd&ref=nb_sb_noss")

soup = BeautifulSoup(page.content, "html.parser")

product = soup.find_all("h2",class_="a-link-normal a-text-normal")
results = soup.find_all("span",class_="a-offscreen")

print(product)

這是我得到的 output：

C:\Users\Kushal\Desktop\requests-tutorial>C:/Users/Kushal/AppData/Local/Programs/Python/Python37/python.exe c:/Users/Kushal/Desktop/requests-tutorial/scraper.py
[]

當我嘗試用 for 循環列出所有內容時，什么都沒有顯示，甚至沒有空方括號

Answer 1

根據您在下面的評論。 我修改了代碼以獲取所述頁面上的所有產品標題以及價格詳細信息。

如果有效，則標記為答案，否則評論以供進一步分析。

import requests
from bs4 import BeautifulSoup
import lxml


dataList = list()
headers = {
    "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5)",
    "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
    "accept-charset": "cp1254,ISO-8859-9,utf-8;q=0.7,*;q=0.3",
    "accept-encoding": "gzip,deflate,sdch",
    "accept-language": "tr,tr-TR,en-US,en;q=0.8",
} 

url = requests.get('https://www.amazon.in/s?k=ssd&ref=nb_sb_noss'.format(), headers=headers)

soup = BeautifulSoup(url.content, 'lxml')

title = soup.find_all('span', attrs={'class':'a-size-medium a-color-base a-text-normal'})
price = soup.find_all('span', attrs={'class':'a-offscreen'})


for product in zip(title,price):
    title,price=product
    title_proper=title.text.strip()
    price_proper=price.text.strip()
    print(title_proper,'-',price_proper)

我在使用 beautifulsoup 進行 web 抓取時遇到了一些問題

問題描述

1 個解決方案

解決方案1
0 2020-09-22 12:32:27

我在使用 beautifulsoup 進行 web 抓取時遇到了一些問題

問題描述

1 個解決方案

解決方案1 0 2020-09-22 12:32:27

解決方案1
0 2020-09-22 12:32:27