0

我想随机绘制术语,按照原文中的方式分布。换句话说,如果“大象”这个词在所有索引文档中出现的频率是“河马”这个词的两倍,那么在我的随机抽取中它应该出现两倍的频率。这应该以有效的方式进行。

在我看来,索引可能不是一个理想的数据结构,但它很诱人:它包含所有术语及其频率。

4

0 回答 0