我收集了文档(比如 10 个文档),我通过存储术语向量以这种方式对它们进行索引
StringReader strRdElt = new StringReader(content);
Document doc = new Document();
String docname=docNames[docNo];
doc.add(new Field("doccontent", strRdElt, Field.TermVector.YES));
IndexWriter iW;
try {
NIOFSDirectory dir = new NIOFSDirectory(new File(pathToIndex)) ;
iW = new IndexWriter(dir, new IndexWriterConfig(Version.LUCENE_35,
new StandardAnalyzer(Version.LUCENE_35)));
iW.addDocument(doc);
iW.close();
}
在索引所有文档之后,我以这种方式获取每个文档的术语频率
IndexReader re = IndexReader.open(FSDirectory.open(new File(pathToIndex)), true) ;
TermFreqVector termsFreq[]; //size of number of documents
for(int i=0;i<noOfDocs;i++){
termsFreq[i] = re.getTermFreqVector(i, "doccontent");
}
我的问题是我没有得到相应的 termfreqncy 向量。说我已经索引的第二个文档,我在“termsFreq [9]”得到了相应的术语频率和术语
这是什么原因?,我怎样才能通过我索引文档的顺序得到相应的termfrequncies?