Python網站源碼提取

Question

我正在使用urllib2下載網站的源代碼，但出了點問題。 來源來自這個網站： http : //www.starfm.com/我想要做的就是下載整個 html ，然后解析它從網站上提取“正在播放”部分。

但是，當我使用此代碼下載源代碼時

response = urllib2.urlopen('http://www.starfm.com/')
html = response.read()
a = open("C:\\users\\Leonardo\\Desktop\\source.txt","w")
a.write(html)
a.close()

最終來源不會在網站的“正在播放”部分中顯示當前藝術家。

為什么？ 我該怎么辦？

非常感謝。

-萊昂納多

Answer 1

“正在播放”來自 javascript，也許它會在 onload() 事件中加載該信息，在這種情況下，您的代碼只是讀取內容。

也許這個問題會幫助你

在 Python 中獲取使用 Javascript 生成的頁面

Python網站源碼提取

問題描述

1 個解決方案

解決方案1
0 已采納 2014-03-30 21:35:25

Python網站源碼提取

問題描述

1 個解決方案

解決方案1 0 已采納 2014-03-30 21:35:25

解決方案1
0 已采納 2014-03-30 21:35:25