0

我知道也许这不是问这个问题的正确地方。我也在微软问答部分问过,我还没有得到任何答案。

我希望有人对我的问题有所了解。

我正在使用 Microsoft 基于 Microsoft-academic-graph 的 LanguageSimilarity 包。这个包返回两个字符串之间的相似度分数。在这个包中,它们提供了预训练的模型并包含算法,封装在 dll(c# 代码)中。

假设我有两个大字符串并调用 languageSimilarity.ComputeSimilarity(s1,s2) 方法。假设,在该字符串中,我有一些单词(一些单词/所有单词)在该包随附的预训练词汇语料库中不可用。在这种情况下,如果模型中没有单词,它将如何返回相似度分数?

Microsoft 语言相似性包

如果有人对此有任何了解,请帮助我。谢谢

4

0 回答 0