我有一个 Azure 表存储解决方案,每个客户最多有几个 tusands“行”(分区键)。
如何最好地进行闪电般快速的免费文本搜索?
由于数据的性质,我无法进行空洞词搜索(例如,搜索“zur”应该匹配“Azure”)。
我有一个 Azure 表存储解决方案,每个客户最多有几个 tusands“行”(分区键)。
如何最好地进行闪电般快速的免费文本搜索?
由于数据的性质,我无法进行空洞词搜索(例如,搜索“zur”应该匹配“Azure”)。
刚刚发现这可能对您有所帮助:Azure Library for Lucene
我们在网站的生产环境中使用以下内容:我们在http://websolr.com上运行托管的 solr(基于 lucene)实例,并使用当前处于测试阶段的新 Azure 分布式缓存功能缓存结果。这给了我们在运行 websolr.com 的 Amazon 数据中心和 Azure 数据中心之间的初始搜索请求的最坏情况 200 毫秒延迟,而所有缓存搜索的平均延迟为 6 到 10 毫秒。我们还记录常见的搜索文本片段,并尝试在缓存中保持新鲜。
目前还没有开箱即用的解决方案。也许会在 PDC10 上宣布全文搜索功能。
因此,目前您需要推出自己的文本索引解决方案。我这样做的方法是在工作者角色上建立一个 Lucene.net 索引。然后,我在该工作角色上打开一个 tcp 端口,该端口使用 WCF 提供搜索服务。然后,任何 Web 角色都可以使用该服务。这非常有效,并提供了非常快速的搜索服务。
Steve Marx 的 PDC09 视频提供了更多信息: http: //www.microsoftpdc.com/2009/SVC16