如何通過單擊/加載更多分頁從站點將 XML 導入 Google 表格

Question

我正在嘗試為每個故事的主題、作者、時間戳和標題抓取新聞故事列表。 該網站列出了 URL 上最近發布的 10 個故事，以 /all-stories 結尾，接下來的 10 個故事在 /all-stories/page/2，接下來的 10 個故事在 /all-stories/page/3，依此類推上。

我有 3 個 IMPORTXML 公式在第一頁捕獲我需要的數據：

=importxml("https://www.example.org/all-stories", "//div[@class='post-item-river__content___2Ae_0']/a")

=IMPORTXML("https://www.example.org/all-stories","//li[@class='post-item-river__wrapper___2c_E- with-image']/div/div")

=IMPORTXML("https://www.example.org/all-stories","//li[@class='post-item-river__wrapper___2c_E- with-image']/div/h3")

如何在 page/2、page/3 等上復制它？

我在 Google 表格中沒有看到任何方法可以做到這一點—— 這個有點相似的故事嘗試涉及在公式中將 &=ROW() 添加到 URL 中。 但是當我嘗試這樣做時，Sheets 將其解釋為 URL 的一部分，並且正確地沒有返回任何內容。

Answer 1

嘗試一個簡單的數組，如：

={IMPORTXML("https://www.sciencenews.org/all-stories", "//div[@class='post-item-river__content___2Ae_0']");
  IMPORTXML("https://www.sciencenews.org/all-stories/page/2", "//div[@class='post-item-river__content___2Ae_0']");
  IMPORTXML("https://www.sciencenews.org/all-stories/page/3", "//div[@class='post-item-river__content___2Ae_0']")}

如何通過單擊/加載更多分頁從站點將 XML 導入 Google 表格

問題描述

1 個解決方案

解決方案1
0 2019-10-15 13:37:59

如何通過單擊/加載更多分頁從站點將 XML 導入 Google 表格

問題描述

1 個解決方案

解決方案1 0 2019-10-15 13:37:59

解決方案1
0 2019-10-15 13:37:59