14

将用户输入的搜索词转换为可在 where 子句中用于全文搜索以查询表并获取相关结果的查询的最佳方法是什么?例如,用户输入的以下查询:

+"e-mail" +attachment -"word document" -"e-learning"

应该翻译成类似的东西:

SELECT * FROM MyTable WHERE (CONTAINS(*, '"e-mail"')) AND (CONTAINS(*, '"attachment"')) AND (NOT CONTAINS(*, '"word document"')) AND (NOT CONTAINS(*, '"e-learning"'))

我目前正在使用一个查询解析器类,它使用正则表达式将用户输入的查询解析为标记,然后从标记构造 where 子句。

但是,鉴于这可能是许多使用全文搜索的系统的共同要求,我很好奇其他开发人员是如何解决这个问题的,以及是否有更好的处理方式。

4

6 回答 6

10

如何使用 .Net / C# / Entity Framework 实现接受的答案...

  1. 使用 nuget 安装 Irony。

  2. 添加示例类:http: //irony.codeplex.com/SourceControl/latest#Irony.Samples/FullTextSearchQueryConverter/SearchGrammar.cs

  3. 编写这样的代码将用户输入的字符串转换为查询。

    var grammar = new Irony.Samples.FullTextSearch.SearchGrammar();
    var parser = new Irony.Parsing.Parser(grammar);
    var parseTree = parser.Parse(userEnteredSearchString);
    string query = Irony.Samples.FullTextSearch.SearchGrammar.ConvertQuery(parseTree.Root);
    
  4. 也许写一个这样的存储过程:

    create procedure [dbo].[SearchLivingFish]
    
    @Query nvarchar(2000)
    
    as
    
    select *
    from Fish
    inner join containstable(Fish, *, @Query, 100) as ft
    on ft.[Key] = FishId
    where IsLiving = 1
    order by rank desc
    
  5. 运行查询。

    var fishes = db.SearchLivingFish(query);
    
于 2015-05-23T06:28:56.197 回答
6

这可能不是您正在寻找的东西,但它可能会为您提供一些进一步的想法。

http://www.sqlservercentral.com/articles/Full-Text+Search+(2008)/64248/

于 2009-02-03T08:17:30.077 回答
3

除了上面@franzo 的回答之外,您可能还想更改 SQL 中的默认停用词行为。否则,包含单个数字(或其他停用词)的查询将不会返回任何结果。

禁用停用词,创建您自己的停用词列表和/或设置要转换的干扰词,如SQL 2008 中所述:关闭全文搜索查询的停用词

要查看(英文)sql 停用词的系统列表,请运行:

select * from sys.fulltext_system_stopwords where language_id = 1033
于 2015-08-11T02:46:24.433 回答
0

我意识到这与您最初的问题有点偏离,但是您是否考虑过放弃 SQL 全文索引并改用Lucene/Solr之类的东西?

于 2009-02-03T08:05:03.673 回答
0

最简单的方法是使用动态 SQL(我知道,在这里插入安全问题)并将短语分解为格式正确的字符串。

您可以使用函数将短语分解为可用于创建新字符串的表变量。

于 2009-02-03T08:20:02.537 回答
0

GoldParser 和 Calitha 的组合应该可以解决您的问题。

这篇文章:http ://www.15seconds.com/issue/070719.htm 也有一个 googleToSql 类,它会为你做一些翻译。

于 2009-10-30T15:38:54.753 回答