[英]Using IMPORTXML on Google Sheets to extract hyperlinks
試圖為“審計”下列出的鏈接抓取coinmarketcap.com 。
Google 表格中的=importXML
function 似乎是為這些審計提取 url 的最佳方法,因為它們的 API 不提供它們。 誰能告訴我如何獲得這些鏈接的 XPath 以便我可以在 Google 表格中創建一個列表? 或者有沒有更好的方法?
要獲得排名第一的超鏈接,它看起來像 ="https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","//*[@id='__next']/div/ div[1]/div[2]/div/div/div[5]/table/tbody/tr[1]/td[3]/div/a/@href")
您可以將 tr[1] 設置為 tr[2] 的排名第二的超鏈接,如下所示 ="https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","//*[@id= '__next']/div/div[1]/div[2]/div/div/div[5]/table/tbody/tr[2]/td[3]/div/a/@href")
您可以將 tr[2] 變成 tr[3] 的排名第三的超鏈接,如下所示,="https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","//*[@id ='__next']/div/div[1]/div[2]/div/div/div[5]/table/tbody/tr[2]/td[3]/div/a/@href")
您可能已經注意到 tr[1] 獲取圖表的行,而 td[3] 獲取該圖表的列/部分。 因此,如果您想要價格部分的超鏈接,請將 td[3] 更改為 td[4]。 @href 獲取 href 的名稱,即主頁之后的網站路徑。 如果您將 @href 排除在外,您將獲得 /a 的值。 這僅適用於具有超鏈接的列/部分。 我沒有看到您的圖片中顯示的審核部分。
下面的公式將為您提供第一行中的所有超鏈接,方法是將 td[1] 轉換為 td[ ] =ArrayFormula("https://coinmarketcap.com"&IMPORTXML("https://coinmarketcap.com/","/ / [@id='__next']/div/div[1]/div[2]/div/div/div[5]/table/tbody/tr[1]/td[*]/div/a/@參考文獻"))
我希望這有幫助!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.