4

我有一个包含 6,000 个公司名称的列表(以及它们的总部地址),我需要找到每个公司的网址。我正在考虑使用 Google Web API(显然这需要几天时间,因为每天只允许 1,000 个查询)来执行此操作(搜索“COMPANY_NAME CITY STATE”),然后获取第一个结果。但是我不能 100% 确定这会奏效,而且我觉得有更好的方法。我可以用任何我真正了解的语言来做到这一点,C++、Java、PHP、Python。这只需要运行一次。

我将如何使用 WHOIS 来执行此操作?如果我已经知道 URL,我知道我会怎么做,但不是相反(名称到 URL)。如果它是私人注册的,我会怎么做?

顺便说一句,这些是美国企业。

4

2 回答 2

1

You can use WHOIS instead of Google API for it.

于 2009-12-03T18:31:37.330 回答
0

Use Amazons Mechanical Turk. It's perfect for these kinds of tasks which can be hard to automate and typically need a person to validate them. It will cost a little but it should be manageable, depending on how bad you want the results.

于 2009-12-03T18:34:39.223 回答