你们将如何在.Net 平台上创建一个“实时”搜索引擎。近乎实时的网络搜索现在非常流行,我希望你们能帮助我集思广益。我最终可能会尝试制作一些原型,但大多数情况下它只是一种“心理训练”。
要求是:
- .NET 平台、IIS、MS SQL 服务器或 Lucene.Net(文件系统)
- 要索引的输入数据只是关键字加上一些元信息 - 不需要进一步处理
- 数据按关键字分组并按关键字出现次数排序
- 不保留历史数据(超过某个固定时间量的数据被丢弃或移动到其他数据存储)
对主题了解不多,这是我迄今为止提出的:
数据通过 Web 服务提供给系统。由于数据已经是关键字的形式,因此不进行进一步的处理。WS 将数据保存到 db。选择查询以固定的时间间隔执行以返回数据(例如:我们查询过去一小时的传入数据并每秒执行一次查询)。分组和排序在内存中执行以卸载 sql server。db 中的旧数据每隔几分钟就会被丢弃一次。我不确定如果不断添加许多新行,sql server 将如何处理。然后显示分组和排序的数据。
我相信你们对这种事情有更多的经验和更好的想法。
问候,
翁德雷