Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在特定域中有一组文本文件。我需要根据一些指标对文件进行排名。
请帮助我提供一些可用于对我的文本文件进行排名的指标(词频、大小、使用频率等)。然后,我想使用文本挖掘技术根据其中一种技术对文件进行排名。
我遇到的主要问题是根据文档的相关性或其他一些指标对文档进行排名。
现在我得出的结论是,根据内容(相关性)对文档进行排名可以提供更好的结果。
我正在使用基于向量的方法根据查询中给出的搜索词对文档进行排名。我不确定这是否是最好的方法,但它提供了平均准确度的结果