從 LinkedIn URL 中提取個人資料名稱 Python

Question

我正在嘗試從以下 URL 中提取配置文件名稱： https://www.linkedin.com/in/zamenajaffer/

理想情況下，我想從 URL 中提取“zamenajaffer”並將其轉換為字符串。

這是我到目前為止所擁有的：

#importing packages for web scraping
from selenium import webdriver
from bs4 import BeautifulSoup
import pandas as pd
import re
import time

### Opening LinkedIn Account ###
#request user input for LinkedIn credentials
print("Please enter your email address: ")
username_string = str(input())
print("Please enter your password: ")
password_string = str(input())

#create browser-specific web navigation simulator (chrome)
browser = webdriver.Chrome(executable_path= '/Applications/Python 3.8/chromedriver')

#open LinkedIn and log in with given details
browser.get('https://www.linkedin.com/login')
elementID = browser.find_element_by_id('username')
elementID.send_keys(username_string)
elementID = browser.find_element_by_id('password')
elementID.send_keys(password_string)
elementID.submit()

#navigate to recent activity page
browser.get('https://www.linkedin.com/in/')
print(browser.current_url)

它目前打印https://www.linkedin.com/in/ 。 我希望它打印的是https://www.linkedin.com/in/zamenajaffer/ ，代碼運行時在瀏覽器中顯示：

Answer 1

您必須在頁面加載時添加延遲，然后才能print(browser.current_url)
所以你可以添加

from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 30)
element = wait.until(EC.visibility_of_element_located((By.CLASS_NAME, 'live-video-hero-image')))

接着

print(browser.current_url)

從 LinkedIn URL 中提取個人資料名稱 Python

問題描述

1 個解決方案

解決方案1
1 已采納 2021-04-28 14:49:53

從 LinkedIn URL 中提取個人資料名稱 Python

問題描述

1 個解決方案

解決方案1 1 已采納 2021-04-28 14:49:53

解決方案1
1 已采納 2021-04-28 14:49:53