0

my_table我有一个带有两个文本字段的表格(我们称之为):titledescription。我还有一个my_index使用下一个源查询的 index():

SELECT * FROM my_table;

当我需要从中获取所有单词和频率时,my_index我会使用以下内容:

$indexer my_index --buildstops word_freq.txt 1000 --buildfreqs

但是现在,我需要获取仅在列中出现的单词title(以及它们的频率仅来自title列)。这样做的最佳解决方案是什么?

编辑: 如果解决方案不会在磁盘空间上构建新索引,那将是完美的。

4

1 回答 1

1

创建一个仅包含标题列的新“索引”。无需使用它构建物理索引,只需将其与 --buildstops 一起使用即可:)

索引继承,允许在配置文件中使用非常紧凑的位创建它

source my_index_title : my_index {
   sql_query = SELECT id,title from my_table
}
index my_index_title : my_index {
   source = my_index_title
   path = /tmp/my_index_title
}
于 2013-02-18T12:28:10.143 回答