0

我收集了文档(比如 10 个文档),我通过存储术语向量以这种方式对它们进行索引

StringReader strRdElt = new StringReader(content);


    Document doc = new Document();
    String docname=docNames[docNo];
    doc.add(new Field("doccontent", strRdElt, Field.TermVector.YES));

    IndexWriter iW;
    try {
        NIOFSDirectory dir = new NIOFSDirectory(new File(pathToIndex)) ;

        iW = new IndexWriter(dir, new IndexWriterConfig(Version.LUCENE_35,
                new StandardAnalyzer(Version.LUCENE_35)));
        iW.addDocument(doc);
        iW.close();

    }

在索引所有文档之后,我以这种方式获取每个文档的术语频率

IndexReader re = IndexReader.open(FSDirectory.open(new File(pathToIndex)), true) ;
TermFreqVector termsFreq[]; //size of number of documents

for(int i=0;i<noOfDocs;i++){
        termsFreq[i] = re.getTermFreqVector(i, "doccontent");
      }

我的问题是我没有得到相应的 termfreqncy 向量。说我已经索引的第二个文档,我在“termsFreq [9]”得到了相应的术语频率和术语

这是什么原因?,我怎样才能通过我索引文档的顺序得到相应的termfrequncies?

4

0 回答 0