我想在 Java 应用程序中使用 Lucene 来计算单词的支持和置信度。我有超过 500 个 .txt 文档,一个 ArrayList 包含两个术语,术语 i 和术语 j
The formula for counting Confidence
Dti-tj/Dti
Dti-tj: Total document contains term i,term j
Dti : Total document contains term i
The formula for counting Support
Dti-tj/D
Dti-tj = Total document contains term i,term j
D = Total Document in the collection
是否可以使用 Lucene 搜索和计算单词?我必须使用什么类?