-3

我有一个项目构想,我想在另一个网站上挖掘通过众包收到的公开可用数据。这样我就有了自己项目的初始数据。重申一下,我想编写一个机器人来抓取显示在另一个网站上的数据并将其用于我自己的网站。有谁知道这种事情的合法性吗?原始网站是否拥有人群提供给它的数据?即使是这样,我可以使用它吗?

4

2 回答 2

2

网络抓取是一个法律上复杂的问题。法律诉讼和可执行性的麻烦常常使爬虫程序免于陷入困境。尽管法院裁定“事实的重复”是允许的(美国),但完全重复被认为是可起诉的。

我建议你在这里阅读:http ://en.wikipedia.org/wiki/Web_scraping#Legal_issues

最好的,

于 2012-11-09T19:03:52.263 回答
1

从法律上讲,你应该没问题。只要提供数据并且得到人们的同意;您没有进行黑客攻击,并且其他站点有权共享。检查另一个站点上的许可证,如果没有一个查询或准备在某个时候拒绝访问。即使它是公开可用的,也不意味着其他站点希望它是。

此外,请仔细检查并确保您不会无意中发布私人数据。

于 2012-11-09T19:06:44.777 回答