簡體 English 中英

在提取特定亞馬遜賣家的所有產品鏈接時如何處理分頁符

[英]How to handle page breaks while extracting all product links for a particular Amazon seller

原文 2017-09-13 11:19:13 1 1 python/ html/ amazon-web-services/ xpath

我正在編寫一個Python程序，以從賣方頁面中提取具有與某個正則表達式模式匹配的href的錨標簽。

例如，我以字母“ A”開頭的第一個賣方URL如下：

/ s / ref = sr_in_A_p_6_1？fst = as％3Aoff＆rh = n％3A2335752011％2Cp_6％3AA15LBIZFCJ59AM

現在，我想要的是通過按照以下模式刮掉帶有hrefs的錨標簽來獲取上述賣方出售的所有產品鏈接

/ Apple工廠解鎖的內部智能手機/ dp / B00NQGP42Y / ref = sr_1_1？m = A15LBIZFCJ59AM

但是第一個URL的產品列表分布在多個頁面上。

鑒於我將Python 2.7和XPATH 1.0字符串函數與regex一起使用，如何處理分頁符？

注意：我使用的是Chrome版本60.0.3112.113（正式版本）（64位）

1 個解決方案

這是執行此操作的兩個選項：

選項1

將&page=3添加到第一個URL的末尾，然后遍歷頁面，直到到達沒有產品鏈接/空消息的頁面。 您可以通過查看是否存在ID為noResultsTitle的元素來檢查是否為空消息。

選項2

在頁面上為該元素查找一個ID為pagnNextLink的標簽-該標簽的href屬性是下一頁。 加載並繼續執行此操作，直到沒有下一頁鏈接/沒有具有該ID的標簽。

從亞馬遜或 FlipKart 等特定賣家的網站獲取產品類別、鏈接、價格、產品描述。就像 web 爬蟲\蜘蛛機器人

[英]Get product category, link,price,product description from Amazon or FlipKart like website of a particular seller. Just Like web Crawler\spiderbot

Python Selenium 發送亞馬遜賣家產品定制消息

[英]Python Selenium Send Amazon Seller Product Customization Message

如何從亞馬遜產品頁面中提取asin

[英]how to extract asin from an amazon product page

檢索特定產品的亞馬遜評論

[英]Retrieve Amazon Reviews for a particular product

如何顯示特定產品的所有評論？

[英]how to display all the reviews for the particular product?

從文章中提取鏈接時如何避免屬性錯誤？

[英]How to avoid attribute error while extracting links from articles?

從python 3中的頁面提取鏈接

[英]extracting links from a page in python 3

如何使用Python獲取amazon.jobs的所有更多閱讀鏈接

[英]How to get all the read more links of amazon.jobs with Python

如何從亞馬遜頁面 python web 刮取產品尺寸

[英]how to get product dimensions from amazon page python web scraping

Amazon Scrape 產品詳細信息頁面

[英]Amazon Scrape Product Detail Page

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 從亞馬遜或 FlipKart 等特定賣家的網站獲取產品類別、鏈接、價格、產品描述。就像 web 爬蟲\蜘蛛機器人 Python Selenium 發送亞馬遜賣家產品定制消息如何從亞馬遜產品頁面中提取asin 檢索特定產品的亞馬遜評論如何顯示特定產品的所有評論？從文章中提取鏈接時如何避免屬性錯誤？從python 3中的頁面提取鏈接如何使用Python獲取amazon.jobs的所有更多閱讀鏈接如何從亞馬遜頁面 python web 刮取產品尺寸 Amazon Scrape 產品詳細信息頁面

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM