1

我正在尝试为 webapp 设置文本搜索。我的mysql查询如下:

SELECT * FROM t1 WHERE MATCH (c1,c2,c3) AGAINST (:keyStr IN BOOLEAN MODE)

我希望 :keyStr 中的所有单词都匹配,所以 keyStr 看起来像:

:keyStr='+word[0]* +word[1]* +word[2]* + ... +word[n]*'

如果任何 word[x] 是停用词或小于最小字长,则查询返回空值。我认为最好的解决方案是从停用词中删除“+”或从 :keyStr 中完全删除停用词。

有什么好的方法可以做到这一点吗?在进行查询之前,我是否需要检查 stopwords_list 中是否有任何 word[x]?

4

1 回答 1

1

使用 javascript 完成此操作的一种简单方法是:

var apart = "Some +example search that I made up".toLowerCase().replace(/[\+\-\?]*/g, '').split(' '),
    stop_words = ['the', 'that', 'a', 'example'],
    min_word_length = 1;

// filter the array to remove stop words
apart.filter( function( item ) {
    if ( item.length < min_word_length ) return false;
    return stop_words.indexOf( item ) === -1;
});

编辑:虽然在伪代码意义上,上面的代码可以工作,这是一个 PHP 解决方案

$query = "This is my example search query";

$search = explode(' ', $query);

$stop_words = array('is', 'a', 'the');

$terms = array_filter($search, function($item){
    return !in_array($item, $stop_words);
});

$formatted = array_map(function($term){
    return '+'.mysql_escape_string($term).'*';
}, $terms);

// :keyStr = implode(' ', $formatted);
于 2013-02-23T22:01:44.937 回答