[英]How to IMPORTXML into Google Sheets from site with next-click/load-more pagination
我正在嘗試為每個故事的主題、作者、時間戳和標題抓取新聞故事列表。 該網站列出了 URL 上最近發布的 10 個故事,以 /all-stories 結尾,接下來的 10 個故事在 /all-stories/page/2,接下來的 10 個故事在 /all-stories/page/3,依此類推上。
我有 3 個 IMPORTXML 公式在第一頁捕獲我需要的數據:
=importxml("https://www.example.org/all-stories", "//div[@class='post-item-river__content___2Ae_0']/a")
=IMPORTXML("https://www.example.org/all-stories","//li[@class='post-item-river__wrapper___2c_E- with-image']/div/div")
=IMPORTXML("https://www.example.org/all-stories","//li[@class='post-item-river__wrapper___2c_E- with-image']/div/h3")
如何在 page/2、page/3 等上復制它?
我在 Google 表格中沒有看到任何方法可以做到這一點—— 這個有點相似的故事嘗試涉及在公式中將 &=ROW() 添加到 URL 中。 但是當我嘗試這樣做時,Sheets 將其解釋為 URL 的一部分,並且正確地沒有返回任何內容。
嘗試一個簡單的數組,如:
={IMPORTXML("https://www.sciencenews.org/all-stories", "//div[@class='post-item-river__content___2Ae_0']");
IMPORTXML("https://www.sciencenews.org/all-stories/page/2", "//div[@class='post-item-river__content___2Ae_0']");
IMPORTXML("https://www.sciencenews.org/all-stories/page/3", "//div[@class='post-item-river__content___2Ae_0']")}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.