0

Python 菜鸟。

我试图让 Python 选择我屏幕的一部分。在这种情况下,它是 Firefox 窗口中的一个小窗口——它是 Firebug 源代码。然后,一旦它选择了正确的区域,control-A 选择全部,然后 control-C 复制。如果我能弄清楚这一点,那么我会做同样的事情并将所有副本粘贴到 .txt 文件中。

我真的不知道从哪里开始——有这类东西的库吗?甚至可能吗?

4

2 回答 2

0

正如您在评论中提到的,数据全部在 HTML 中开始(我猜它在您的 Firebug 屏幕截图中显示为灰色,因为它是一个隐藏元素)。这种方法避免了尝试自动化浏览器的复杂性。以下是我如何获取数据的粗略概述:

  • 下载整个页面的 HTML - 我首先会手动执行此操作(即从浏览器中的文件 > 保存),如果您要处理大量页面,请弄清楚如何下载您以后想要的所有页面. 如果你想在这部分使用 python,我推荐urllib2。每个页面的 URL 可能非常结构化,因此您可以轻松地将它们存储在列表中,然后下载每个页面并将其保存在本地。.

  • 编写一个脚本来解析 HTML -不要使用 regex。由于您使用的是 Python,因此请使用Beautiful Soup之类的东西,它将为页面创建一个很好的对象表示,然后您可以获得所需的元素。

你提到你是python的新手,所以肯定会有一个学习曲线,但这实际上听起来像是一个非常可行的项目,可以用来学习更多的python。

如果您在每一步都遇到了特定的障碍,请使用一些示例代码开始一个新问题,展示您要完成的工作,人们会非常愿意提供帮助。

于 2013-03-26T16:40:52.470 回答
0

我会研究 PyQt 或 PySide,它们是 Qt 顶部的 Python 包装器。Qt 是一个大怪物,但它有很好的文档记录,我相信一旦你抓住你的屏幕部分,它会帮助你在你的项目中进一步发展。

于 2013-03-26T01:09:16.547 回答