簡體   English   中英

如何通過單擊/加載更多分頁從站點將 XML 導入 Google 表格

[英]How to IMPORTXML into Google Sheets from site with next-click/load-more pagination

我正在嘗試為每個故事的主題、作者、時間戳和標題抓取新聞故事列表。 該網站列出了 URL 上最近發布的 10 個故事,以 /all-stories 結尾,接下來的 10 個故事在 /all-stories/page/2,接下來的 10 個故事在 /all-stories/page/3,依此類推上。

我有 3 個 IMPORTXML 公式在第一頁捕獲我需要的數據:

=importxml("https://www.example.org/all-stories", "//div[@class='post-item-river__content___2Ae_0']/a")

=IMPORTXML("https://www.example.org/all-stories","//li[@class='post-item-river__wrapper___2c_E- with-image']/div/div")

=IMPORTXML("https://www.example.org/all-stories","//li[@class='post-item-river__wrapper___2c_E- with-image']/div/h3")

如何在 page/2、page/3 等上復制它?

我在 Google 表格中沒有看到任何方法可以做到這一點—— 這個有點相似的故事嘗試涉及在公式中將 &=ROW() 添加到 URL 中。 但是當我嘗試這樣做時,Sheets 將其解釋為 URL 的一部分,並且正確地沒有返回任何內容。

嘗試一個簡單的數組,如:

={IMPORTXML("https://www.sciencenews.org/all-stories", "//div[@class='post-item-river__content___2Ae_0']");
  IMPORTXML("https://www.sciencenews.org/all-stories/page/2", "//div[@class='post-item-river__content___2Ae_0']");
  IMPORTXML("https://www.sciencenews.org/all-stories/page/3", "//div[@class='post-item-river__content___2Ae_0']")}

在此處輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM