簡體   English   中英

從網頁保存動態內容?

[英]Saving dynamic content from web page?

是否可以從網站保存動態文本並將其轉儲到服務器上的文件中? 我感興趣的特定情況是從此頁面http://www.z1035.com/player.php保存歌曲標題,並將所有歌曲標題保存在服務器上的文件中。 這可能嗎? 我可以使用什么方法來做到這一點?

您所指的通常稱為“抓取”。 這是有關使用PHP的一種方法的文章:

http://www.developertutorials.com/blog/php/easy-screen-scraping-in-php-simple-html-dom-library-simplehtmldom-398/

我認為,Python的URLLib庫使抓取非常容易。

import urllib, re

url = "http://www.z1035.com/player.php"
f = urllib.urlopen(url)
t = f.read()
#  use regular expression here 
m = re.search(t, "some pattern")
print m.group(1)

這將加載外部資源,就好像它是本地文件一樣,並允許您根據需要進行解析。

從前,我想保存我收聽的廣播節目的所有曲目列表。 我使用Python下載了所有跟蹤列表的列表,然后以編程方式訪問每個跟蹤列表並將其內容附加到文件中。 這非常方便,大概花了20行。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM