簡體   English   中英

如何從帶有 Python 的按鈕中抓取隱藏的超鏈接?

[英]How to scrape a hidden hyperlink from a button with Python?

我正在嘗試為一個項目抓取以下網站: https://www.tunefind.com/show/chicago-fire/season-1/12210最后一步是抓取頁面上提到的 spotify 歌曲的鏈接。 通常我會查看源代碼,從那里很清楚。 但是,在這種情況下不是。 查看 spotify 按鈕周圍的源代碼,我找不到指向這首歌的超鏈接。 可能是故意做的,以防止刮擦? (糟糕)

有沒有辦法從按鈕獲取超鏈接? 我知道 Python 中的“inte.net”界面可以點擊按鈕,但我不想使用它,因為這會極大地影響加載時間。

謝謝!

你通過抓取網站做錯了。 如果他們改變了一件事情,你的整個項目就會停止工作。 您應該改用他們的 API。 https://www.tunefind.com/product/api

如果使用 Chorme,請查看 DevTools,go 到“網絡”選項卡並重新加載站點。 你會發現你需要的數據在這個url中:

https://www.tunefind.com/api/frontend/show/chicago-fire/season/1?fields=episodes,theme-song,music-supervisors,hot-songs,top-users,related-questions-season,作曲家、專輯和元標簽=1

不確定這是否對您有幫助,但所有數據都已加載到window.__INITIAL_STATE__

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM