microsoft-academic-graph - 微软语言相似度包

问问题 2021-05-21T02:47:46.463

25 次

我知道也许这不是问这个问题的正确地方。我也在微软问答部分问过，我还没有得到任何答案。

我希望有人对我的问题有所了解。

我正在使用 Microsoft 基于 Microsoft-academic-graph 的 LanguageSimilarity 包。这个包返回两个字符串之间的相似度分数。在这个包中，它们提供了预训练的模型并包含算法，封装在 dll（c# 代码）中。

假设我有两个大字符串并调用 languageSimilarity.ComputeSimilarity(s1,s2) 方法。假设，在该字符串中，我有一些单词（一些单词/所有单词）在该包随附的预训练词汇语料库中不可用。在这种情况下，如果模型中没有单词，它将如何返回相似度分数？

如果有人对此有任何了解，请帮助我。谢谢

0 回答 0