Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
目前我正在分析大量的文本。我想对两个词表执行对数似然比,以识别前景语料库与规范语料库中术语的频率偏差。我已经在 Python 中编写了对数似然编码,但是在二元组上运行代码会导致计算机速度慢和等待时间长。我刚刚读到我可以使用 PyLucene 索引我的语料库,这将加快语料库上的运行任务。有足够的文档如何索引,但我在某个地方读到了 PyLucene 中存在的对数似然比函数。有人知道这个功能吗?提前致谢。