0

我们已经建立了一个非常全面的全国零售商数据库,具有特定的标准。花了一年多的电话采访等,才把名单放在一起。当然,该列表不会在我们的网站上公开提供以作为平面文件下载……那太愚蠢了。

但是所有内容都可以通过谷歌地图在网站上搜索到。所以理论上,通过足够的邮政编码搜索,最终有人可以获取所有零售商数据。当然,我们不希望这样,因为我们的整个模型是进行编译该数据库所需的研究和采访,并将其提供给最终用户以供在我们的网站上使用。

因此,我们得出的结论是,实际上没有任何方法可以保护数据不被集体获取,而是一个潜在的竞争网站。但是有没有办法给数据加水印?由于在我们的数据库中预先计算了纬度/经度,我们不需要地址 100% 正确。例如,我们正在考虑将“1776 3rd St”替换为“1776 Third Street”,或者将标准字符替换为 unicode 替换。这样,如果我们恰好在竞争网站上找到这些数据,我们就会知道这是抄袭。不利的一面是,如果用户试图将修改后的地址剪切并粘贴到他们自己的谷歌地图实例中——在某些情况下,修改会使其变得困难。

其他具有有价值的公开分发内容的网站如何应对这一挑战?有什么建议么?

谢谢

4

1 回答 1

1

如果您问我,这是“公开分发”与“不公开分发”的问题。如果你真的想分发它,你应该承认有人可以接收数据。

对于某些类型的数据(如照片、电影等媒体),您可以对数据加水印或以其他方式篡改数据,使其变得可追踪,但如果您的内容与您的内容相似,这将变得很难,甚至更难防御:如果您使用 "第三条街”,别人也用,你觉得可以告他们吗?我对此表示高度怀疑。

我能想到的唯一步骤是

  • 使获取所有信息变得更加困难。将其隐藏在脚本和其他东西后面而不是将其放在谷歌地图上,确保它尽可能地让机器人获取信息,限制向一个用户显示的结果数量等。这很可能意味着你的服务对最终用户的吸引力较小,这是一种权衡

  • 与上述相反:使用相同的技术为普通用户隐藏一些数据,而不是向他们显示。这将是假数据,普通人不应该看到。如果这些零售商出现在您的竞争对手面前,您就已经抓住了他们。这当然不是万无一失的,因为他们可以检查结果的有效性并删除您的虚假内容,具有奇怪系统的用户总是有可能获得虚假数据,这会使您提供的内容不那么正确,最后如果您的竞争对手' 刮板看起来太像真实用户,它不会获取数据。

  • 提供两步信息:在第一步中,您可以获得“关于”信息,任何人都可以找到。在第 2 步中,在您确认这是用户想要的(可能是登录名,可能只是请求限制等)之后,您可以提供一切。因此,如果用户搜索容易到达的零售商,首先说明您在哪个区域有一些,并在地图上“大致”显示,如果他们选择了某些东西,请在有限的环境中向他们显示真正的信息是什么.

于 2012-06-13T15:01:58.010 回答