我想从我的产品数据库表中获取流行的单词和短语(最多 3 个单词)。
我尝试使用 sphinxsearch 服务,这很棒,除了..
它给出的结果是简单的 txt 单词 - 没有 products 表中的斯洛文尼亚特殊字符 (čžš)
结果只有单个单词,没有短语
sphinx 是从索引构建的……所有这些(包括构建索引)对于 100,000 个产品大约需要 2 分钟……
这令人印象深刻..因为我偶尔需要这个(1/月)...
但如前所述,在我的情况下无法使用....
还有什么其他选择?
我需要大约 5,000 个单词和短语
编辑我的产品数据库源
source products_src
{
type = mysql
sql_host = localhost
sql_user = root
sql_pass = xxxxxxxxxx
sql_db = xxxxxxxxx
sql_query_pre = SET CHARACTER_SET_RESULTS=utf8
sql_query_pre = SET NAMES utf8
sql_query = \
SELECT id, title, summary, keywords, text, category_id, company_id, created \
FROM products WHERE status='A'
sql_attr_uint = category_id
sql_attr_uint = company_id
sql_attr_timestamp = created
sql_attr_string = title
sql_attr_string = text
sql_query_info = SELECT id, category_id, title FROM products WHERE id=$id
}