簡體   English   中英

在 Google Sheets 上使用 IMPORTXML 提取超鏈接

[英]Using IMPORTXML on Google Sheets to extract hyperlinks

試圖為“審計”下列出的鏈接抓取coinmarketcap.com

Google 表格中的=importXML function 似乎是為這些審計提取 url 的最佳方法,因為它們的 API 不提供它們。 誰能告訴我如何獲得這些鏈接的 XPath 以便我可以在 Google 表格中創建一個列表? 或者有沒有更好的方法?

我正在尋找的 url 示例

要獲得排名第一的超鏈接,它看起來像 ="https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","//*[@id='__next']/div/ div[1]/div[2]/div/div/div[5]/table/tbody/tr[1]/td[3]/div/a/@href")

您可以將 tr[1] 設置為 tr[2] 的排名第二的超鏈接,如下所示 ="https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","//*[@id= '__next']/div/div[1]/div[2]/div/div/div[5]/table/tbody/tr[2]/td[3]/div/a/@href")

您可以將 tr[2] 變成 tr[3] 的排名第三的超鏈接,如下所示,="https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","//*[@id ='__next']/div/div[1]/div[2]/div/div/div[5]/table/tbody/tr[2]/td[3]/div/a/@href")

您可能已經注意到 tr[1] 獲取圖表的行,而 td[3] 獲取該圖表的列/部分。 因此,如果您想要價格部分的超鏈接,請將 td[3] 更改為 td[4]。 @href 獲取 href 的名稱,即主頁之后的網站路徑。 如果您將 @href 排除在外,您將獲得 /a 的值。 這僅適用於具有超鏈接的列/部分。 我沒有看到您的圖片中顯示的審核部分。

下面的公式將為您提供第一行中的所有超鏈接,方法是將 td[1] 轉換為 td[ ] =ArrayFormula("https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","/ / [@id='__next']/div/div[1]/div[2]/div/div/div[5]/table/tbody/tr[1]/td[*]/div/a/@參考文獻"))

我希望這有幫助!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM