0

我正在为我的工作做一个项目,并试图从 GA bar 网站上获取律师的联系信息。我已经搜索了执行此操作的程序,但没有找到任何我需要的东西。

我需要将所有律师信息都输入到 Excel 中,并且我认为有一些批处理文本程序可以完成这项工作。列出了超过 50,000 个联系人,我真的不认为我需要单击每个链接来查看信息才能访问它。

我在 chrome 上用“检查元素”打开了页面上的代码,发现每个律师在网站上都有一个唯一的 ID。我觉得他们的信息可以很容易地从网站上复制,但我的编程知识非常有限。

有什么建议么?

4

1 回答 1

1

第一步是检查 GA 酒吧网站的服务条款/版权,并确保您被允许这样做。

在开始编码之前,您可以考虑以数据库格式请求联系信息。这些信息可能是免费的,也可能是低于您编写解决方案的成本的费用。

如果你必须编程,一个非常强大的用于抓取网站内容的库是HTML Agility Pack。我建议您熟悉它,并在您了解细节时在此处发布更详细的问题。

HTML Agility Pack 确实需要编程。如果您正在寻找非编程解决方案,Stack Overflow 不是合适的地方。

于 2013-01-15T04:44:52.330 回答