簡體   English   中英

網頁抓取注冊重置網站

[英]Web Scraping the Registration Reset Website

我試圖對網絡抓取這個網站有所了解。 本質上,我要做的是使用標題鍵作為從網站上抓取數據並創建元組列表的一種方式,我會將其轉換為數據框。

問題是導航以顯示不同的結果並使用 for 循環來執行此操作(例如從前 50 個結果導航到接下來的 50 個結果。

我需要訪問什么屬性、類等,以便我可以從一個選項卡到另一個選項卡進行迭代,直到達到最大行數?

https://www6.sos.state.oh.us/ords/f?p=119:REGRESET:0

會發生什么是檢查元素中顯示的類,有時實際類是不同的。 嘗試將頁面編寫為二進制文件,例如:

import requests
html = requests.request("GET","https://www6.sos.state.oh.us/ords/f?p=119:REGRESET:0"
f = open("file.html", "w+")
f.write(str(html))
f.close()

在瀏覽器中打開文件,然后檢查它,您將獲得要抓取的正確類。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM