Python web 抓取，程序無法啟動

Question

我是 Java 和 C# 開發人員，目前正在學習 Python（網頁抓取，具體）。 當我嘗試啟動我的腳本（只需雙擊它）時，它不會打開。 終端打開幾毫秒，然后關閉。 我犯了什么錯誤？

import pandas as pd
import numpy as np
import requests
from bs4 import BeautifulSoup

product_all_pages = []

for i in range(1,15):
    response = requests.get("https://www.bol.com/nl/s/?page={i}&searchtext=hand+sanitizer&view=list")
    content = response.content
    parser = BeautifulSoup(content, 'html.parser')
    body = parser.body
    producten = body.find_all(class_="product-item--row js_item_root")
    product_all_pages.extend(producten)
    
len(product_all_pages)

price = float(product_all_pages[1].meta.get('content'))
productname = product_all_pages[1].find(class_="product-title--inline").a.getText()
print(price)
print(productname)

productlijst = []

for item in product_all_pages:
    if item.find(class_="product-prices").getText() == '\nNiet leverbaar\n':
        price = None
    else:
        price = float(item.meta['content'])
    product = item.find(class_="product-title--inline").a.getText()
    productlijst.append([product, price])
    
print(productlijst[:3])

df = pd.DataFrame(productlijst, columns=["Product", "price"])
print(df.shape)
df["price"].describe()

Answer 1

嘗試從命令行運行您的代碼，然后您可以看到調試 output。 您的代碼會引發AttributeError ，因為content不包含數據。 問題是 url 未格式化，因為您沒有啟動 f 字符串格式化。 這應該有效：

response = requests.get(f"https://www.bol.com/nl/s/?page={i}&searchtext=hand+sanitizer&view=list")

Python web 抓取，程序無法啟動

問題描述

1 個解決方案

解決方案1
1 2021-05-04 17:36:18

Python web 抓取，程序無法啟動

問題描述

1 個解決方案

解決方案1 1 2021-05-04 17:36:18

解決方案1
1 2021-05-04 17:36:18