我是翻译研究的博士生,目前正在撰写我的论文。我在我的论文中使用 LSA 相似性接口作为分析方法。我的背景是语言学而不是计算机科学。我试图找到一个简单的 LSA 文档分类工具,但我找不到任何工具。我试着和 Gensim 一起玩,我没有工作。我认为我的问题是将我的语料库(txt 文件)与 Gensim 工具链接以进行分析(我不知道如何执行此步骤)。如果有人可以帮助我进行分析或指导我使用任何工具或简单的教程来使用 Gensim 进行分析,我将不胜感激。
我想做以下事情:我想应用文档文档查询来从语料库中检索最相关的 5 个文档到查询文档。
- 我有 15 个查询文件
- 我有一个语料库(150 个文本)文本是短篇小说
我很绝望,我很犹豫在这里发布这个问题。我确信在翻译研究中应用 LSA 会增加这个领域,这让我更加坚持找到一种方法来进行我的分析。