java - 通过相应的文档顺序获取术语频率被索引

翻译自：https://stackoverflow.com/questions/10547516 2012-05-11T07:52:14.333

54 次

我收集了文档（比如 10 个文档），我通过存储术语向量以这种方式对它们进行索引

StringReader strRdElt = new StringReader(content);


    Document doc = new Document();
    String docname=docNames[docNo];
    doc.add(new Field("doccontent", strRdElt, Field.TermVector.YES));

    IndexWriter iW;
    try {
        NIOFSDirectory dir = new NIOFSDirectory(new File(pathToIndex)) ;

        iW = new IndexWriter(dir, new IndexWriterConfig(Version.LUCENE_35,
                new StandardAnalyzer(Version.LUCENE_35)));
        iW.addDocument(doc);
        iW.close();

    }

在索引所有文档之后，我以这种方式获取每个文档的术语频率

IndexReader re = IndexReader.open(FSDirectory.open(new File(pathToIndex)), true) ;
TermFreqVector termsFreq[]; //size of number of documents

for(int i=0;i<noOfDocs;i++){
        termsFreq[i] = re.getTermFreqVector(i, "doccontent");
      }

我的问题是我没有得到相应的 termfreqncy 向量。说我已经索引的第二个文档，我在“termsFreq [9]”得到了相应的术语频率和术语

这是什么原因？，我怎样才能通过我索引文档的顺序得到相应的termfrequncies？

java - 通过相应的文档顺序获取术语频率被索引

0 回答 0

Related

Reference