2

我工作的公司从事发送新闻稿的业务。我们希望让感兴趣的各方能够根据一系列标准搜索新闻稿,其中最重要的是位置。例如,某人可能会在“交通”主题下搜索发送到马萨诸塞州纽约市或邮政编码 89134、从政府机构发送的所有新闻。管他呢。

问题是,我们实际上已经发送了数十万份新闻稿。搜索缓慢而复杂。例如,发送到纽约皇后区的新闻稿应该出现在我上面提到的搜索中,即使它不是专门发送到纽约市的,因为皇后区是纽约市的一个子集。我们可能还想对查询实现“and”和“or”以及否定和文本搜索,以创建复杂的搜索。这些搜索还必须足够快才能用作动态 RSS 提要。

我真的对搜索理论一无所知,也不知道它是如何正确完成的。我们现在采用的方式是使用数据集市将版本发送到的位置存储在单个表中。但是,由于上面提到的子集,数据集市是巨大的,有数百万行。而且我们甚至还没有实施城市,美国大约有 50,000 个城市,这将成倍增加数据集市的规模,恐怕它不再起作用了。

无论如何,我意识到这不是一个简单的问题,也不会有“这样做”的答案。但是,我希望你们中的某个人能指出我正确的方向,在那里我可以了解如何进行大规模搜索?因为我真的对此一无所知。事实证明,这样的搜索引擎非常难以制作。谢谢!我知道一定有办法,因为如果 Google 可以搜索整个互联网,我们必须能够搜索我们自己的数据库 :-)

4

1 回答 1

0

Google 可以通过Google Appliance搜索整个互联网以及您的数据!

于 2010-03-30T19:40:48.167 回答