0

现在,我遇到了一个有趣的情况……我的目标是拥有一个软件,它可以接受一个人的全名、出生日期和其他一些凭据(它们是有争议的),并从互联网上提取尽可能多的关于他的信息尽可能...

现在我做了一些研究,发现通过使用 google 的搜索 API 和诸如 Scrapy 之类的网络爬虫,我可以在一定程度上实现这个目标......但简单地在 google 上用双引号搜索人名并不总是会产生正确的结果...

这里想到了两个问题......如何提高准确性,其次,我是否在重新发明轮子(因为有些网站有能力找到人......)?如果是这样,那么那里是否已经有开源代码(或任何可用的东西)可以做到这一点或类似的东西......?

4

1 回答 1

1

这个答案与如何在大量 URL 上使用刮板有关。例如,您可以从 SmokeDoc 开始。

于 2013-02-28T19:02:19.833 回答