美麗的湯圖像刮板問題

Question

我得到以下回溯：

Traceback (most recent call last):
  File "/home/ro/image_scrape_test.py", line 20, in <module>
    soup = BeautifulSoup(searched, "lxml")
  File "/usr/local/lib/python3.4/dist-packages/bs4/__init__.py", line 176, in __init__
    elif len(markup) <= 256:
TypeError: object of type 'NoneType' has no len()

到目前為止，這是我的代碼：

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import urllib

#searches google images
driver = webdriver.Firefox()
google_images = ("https://www.google.com/search?site=imghp&tbm=isch source=hp&biw=1366&bih=648&q=")
search_term = input("what is your search term")
searched = driver.get("{0}{1}".format(google_images, search_term))

def savepic(url):
    uri = ("/home/ro/image scrape/images/download.jpg")
    if url != "":
        urllib.urlretrieve(url, uri)

soup = BeautifulSoup(searched, "lxml")
soup1 = soup.content
images = soup1.find_all("a")

for image in images:
    savepic(image)

我剛開始，所以我很感謝有關如何改進代碼的任何提示。 謝謝

Answer 1

driver.get()在瀏覽器中加載網頁並返回None ，這使searched到的變量具有None值。

您可能打算改為獲取.page_source ：

soup = BeautifulSoup(driver.page_source, "lxml")

這里還有兩點：

您實際上實際上不需要BeautifulSoup您可以使用driver.find_elements_by_tag_name()找到selenium的所需圖像
我尚未測試您的代碼，但我認為您需要添加其他“ 顯式等待”以使selenium等待頁面加載

Answer 2

searched為None 。 顯然，您使用的網址無效。

美麗的湯圖像刮板問題

問題描述

2 個解決方案

解決方案1
1 2015-10-11 16:18:06

解決方案2
0 2015-10-11 15:56:33

美麗的湯圖像刮板問題

問題描述

2 個解決方案

解決方案1 1 2015-10-11 16:18:06

解決方案2 0 2015-10-11 15:56:33

解決方案1
1 2015-10-11 16:18:06

解決方案2
0 2015-10-11 15:56:33