簡體   English   中英

Python Selenium 認證代理

[英]Python Selenium authentication proxy

我正在嘗試在 selenium 上使用具有身份驗證的代理。我見過很多這樣的例子

from selenium import webdriver
PROXY = "23.23.23.23:3128" # IP:PORT or HOST:PORT

options = webdriver.ChromeOptions()
options.add_argument('--proxy-server=%s' % PROXY)

chrome = webdriver.Chrome('./chromedriver',options=options) 
chrome.get("http://whatismyipaddress.com")

我不確定應該在哪里輸入用戶名和密碼或如何進行身份驗證。 有關於那個的文件嗎?

正如我在這里回答的那樣。

如果您需要在 python 和 Selenium 庫中使用沒有身份驗證(沒有用戶名或密碼)的代理和 chromedriver,您通常使用以下代碼:

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--proxy-server=%s' % hostname + ":" + port)
driver = webdriver.Chrome(chrome_options=chrome_options)

除非代理需要身份驗證,否則它工作正常。 如果代理要求您使用用戶名和密碼登錄,它將不起作用。 在這種情況下,您必須使用下面解釋的更棘手的解決方案。

要設置代理身份驗證,我們將生成一個文件並使用下面的代碼將其動態上傳到 chromedriver。 這有效地創建了一個 chrome 擴展。 此代碼使用 chromedriver 配置 selenium 以使用需要使用用戶/密碼對進行身份驗證的 HTTP 代理。

import os
import zipfile

from selenium import webdriver


def create_chromedriver(PROXY_HOST, PROXY_PORT, PROXY_USER, PROXY_PASS, USER_AGENT):
    manifest_json = """
    {
    "version": "1.0.0",
    "manifest_version": 2,
    "name": "Chrome Proxy",
    "permissions": [
        "proxy",
        "tabs",
        "unlimitedStorage",
        "storage",
        "<all_urls>",
        "webRequest",
        "webRequestBlocking"
    ],
    "background": {
        "scripts": ["background.js"]
    },
    "minimum_chrome_version":"22.0.0"
    }
    """

    background_js = """
    var config = {
        mode: "fixed_servers",
        rules: {
        singleProxy: {
            scheme: "http",
            host: "%s",
            port: parseInt(%s)
        },
        bypassList: ["localhost"]
        }
    };

    chrome.proxy.settings.set({value: config, scope: "regular"}, function() {});

    function callbackFn(details) {
        return {
            authCredentials: {
            username: "%s",
            password: "%s"
            }
        };
    }

    chrome.webRequest.onAuthRequired.addListener(
            callbackFn,
            {urls: ["<all_urls>"]},
            ['blocking']
    );
    """ % (PROXY_HOST, PROXY_PORT, PROXY_USER, PROXY_PASS)


    def get_chromedriver(use_proxy=True, user_agent=USER_AGENT):
        path = os.path.dirname(os.path.abspath(__file__))
        chrome_options = webdriver.ChromeOptions()
        if use_proxy:
            pluginfile = 'proxy_auth_plugin.zip'
            with zipfile.ZipFile(pluginfile, 'w') as zp:
                zp.writestr("manifest.json", manifest_json)
                zp.writestr("background.js", background_js)
            chrome_options.add_extension(pluginfile)
        if user_agent:
            chrome_options.add_argument('--user-agent=%s' % USER_AGENT)
        driver = webdriver.Chrome(
            os.path.join(path, 'chromedriver'),
            chrome_options=chrome_options)
        return driver

    driver = get_chromedriver(use_proxy=True)
    # driver.get('https://www.google.com/search?q=my+ip+address')
    driver.get('https://httpbin.org/ip')


user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
create_chromedriver('192.168.3.2', 8080, 'user', 'pass', user_agent)

Function get_chromedriver返回已配置的 selenium web 驅動程序,您可以在您的應用程序中使用該驅動程序。 此代碼已經過測試並且工作正常。

要將此實現到您自己的代碼中,只需調用 function create_chromedriver並使用主機、端口、用戶、通行證和用戶代理作為參數。 如果您不想使用代理或用戶代理,只需相應地編輯get_chromedriver以使參數為假。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM