是否可以从网站保存动态文本并将其转储到我服务器上的文件中?我感兴趣的具体案例是从该页面http://www.z1035.com/player.php 保存歌曲标题,并将所有歌曲标题保存在我服务器上的文件中。这可能吗?我可以使用什么方法来做到这一点?
问问题
1591 次
2 回答
5
您所指的通常称为“刮擦”。这是一篇关于使用 PHP 的一种方法的文章:
于 2009-08-04T22:29:20.173 回答
0
在我看来,Python 的 URLLib 库使抓取变得非常容易。
import urllib, re
url = "http://www.z1035.com/player.php"
f = urllib.urlopen(url)
t = f.read()
# use regular expression here
m = re.search(t, "some pattern")
print m.group(1)
这将加载外部资源,就好像它是本地文件一样,并允许您根据需要对其进行解析。
曾几何时,我想保存我听过的广播节目的所有曲目列表。我使用 Python 下载了所有曲目列表的列表,然后以编程方式访问每个曲目并将内容附加到文件中。它非常方便,大概花了 20 行。
于 2009-08-04T23:03:29.167 回答