我正在尝试找到匹配的“最佳”方式,例如,RSS 文章中的政客姓名。这些名称将存储在使用 NHibernate 访问的数据库中。举个例子:
标识名称 --- --------------- 1 大卫卡梅隆 2 乔治·奥斯本 3 阿利斯泰尔亲爱的
在撰写本文时,BBC 政治新闻 RSS 提要有一个项目的描述
后座保守党议员向总理乔治奥斯本施加压力,要求其阻止英格兰的铁路公司将通勤票价提高 11%。
对于这篇文章,我想检测到提到了 George Osborne。我意识到有几种方法可以做到这一点,例如首先选择所有政治家的名字,然后在代码中比较它们,或者执行 NHibernate 等效的 LIKE。
应用程序本身将有几十个提要,最多每 15 分钟查询一次。显然存在速度、内存和扩展问题,所以我想寻求推荐的方法(如果相关,还有 NHibernate 查询)。