0

我有兴趣了解有关 Mac OS X 中屏幕抓取的更多信息。

基本上,我正在考虑它的原因是有一个喜剧演员有一个非常有趣的假推特账户,阅读所有过去推文的唯一方法是通过我找到的存档网站。该站点的设置方式是它是一个主页,并且在过去两年中每天都有一个链接(只是页面下方的基本锚标记)。这是一个非常简单的网站,我想如果我能够抓取数据并将其放入文件中,我可以在一个地方阅读所有内容,而不是点击数百个链接。

我基本上以此为借口来学习这种编码方法。

我用谷歌搜索,似乎找不到太多东西。我有点了解 PHP 代码(我在 PHP 方面很不错),但不确定是否可以从页面上的链接中抓取数据。从单个屏幕上抓取似乎相对容易。

我的另一个问题是你如何运行代码?我见过几个适用于 Windows 和 Linux 的程序,但我还没有看到适用于 Mac OS X 的程序(我使用的是 OS 10.8)。

有人能指出我正确的方向吗?谢谢!

4

1 回答 1

1

将此项目视为学习 python 的借口。上手速度非常快,并且有很多很棒的软件包可以处理几乎所有你能想到的东西,包括这个。

几周前我把它加了书签:

http://jeanphix.me/Ghost.py/

它是一个 python webkit 客户端——你基本上可以用几行代码从页面中提取任何你想要的东西。

于 2012-08-16T03:12:42.440 回答