[英]Python website source extraction
我正在使用urllib2
下載網站的源代碼,但出了點問題。 來源來自這個網站: http : //www.starfm.com/我想要做的就是下載整個 html ,然后解析它從網站上提取“正在播放”部分。
但是,當我使用此代碼下載源代碼時
response = urllib2.urlopen('http://www.starfm.com/')
html = response.read()
a = open("C:\\users\\Leonardo\\Desktop\\source.txt","w")
a.write(html)
a.close()
最終來源不會在網站的“正在播放”部分中顯示當前藝術家。
為什么? 我該怎么辦?
非常感謝。
-萊昂納多
“正在播放”來自 javascript,也許它會在 onload() 事件中加載該信息,在這種情況下,您的代碼只是讀取內容。
也許這個問題會幫助你
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.