假设任何屈折语言都有一个非常大的语料库。以下内容有意义吗?通过在这样的语料库上应用 LSA,具有相似概念的词在向量空间中会聚在一起,因此指代相同概念的变形词形式在理想情况下应该与其在空间中的引理相同。有了这样的假设,就不需要对查询或语料库进行任何词形还原或词干化。还是我完全错了?
问问题
265 次
假设任何屈折语言都有一个非常大的语料库。以下内容有意义吗?通过在这样的语料库上应用 LSA,具有相似概念的词在向量空间中会聚在一起,因此指代相同概念的变形词形式在理想情况下应该与其在空间中的引理相同。有了这样的假设,就不需要对查询或语料库进行任何词形还原或词干化。还是我完全错了?