0

我想从我的产品数据库表中获取流行的单词和短语(最多 3 个单词)。

我尝试使用 sphinxsearch 服务,这很棒,除了..

  1. 它给出的结果是简单的 txt 单词 - 没有 products 表中的斯洛文尼亚特殊字符 (čžš)

  2. 结果只有单个单词,没有短语

sphinx 是从索引构建的……所有这些(包括构建索引)对于 100,000 个产品大约需要 2 分钟……

这令人印象深刻..因为我偶尔需要这个(1/月)...

但如前所述,在我的情况下无法使用....

还有什么其他选择?

我需要大约 5,000 个单词和短语

编辑我的产品数据库源

source products_src
{
    type            = mysql

    sql_host        = localhost
    sql_user        = root
    sql_pass        = xxxxxxxxxx
    sql_db          = xxxxxxxxx

    sql_query_pre = SET CHARACTER_SET_RESULTS=utf8
    sql_query_pre = SET NAMES utf8

    sql_query       = \
        SELECT id, title, summary, keywords, text, category_id, company_id, created \
        FROM products WHERE status='A'

    sql_attr_uint = category_id
    sql_attr_uint = company_id
    sql_attr_timestamp = created
    sql_attr_string = title
    sql_attr_string = text

    sql_query_info      = SELECT id, category_id, title FROM products WHERE id=$id
}
4

0 回答 0