使用 Google Cloud Vision API 后,我收到了格式为/m/XXXXXXX
(但不一定是 7 个字符)的 MID 值。我想做的是确定一个 MID 值与其他值相比的具体程度。本质上,一个术语有多宽泛与多精炼。例如,术语Vehicle可能是级别 1而术语Van可能是级别 2。
我尝试通过 Google Knowledge Graph API 运行 MID 值,但不幸的是,这些 MID 不在该数据库中并且不返回任何信息。例如,我的一些 MID 和描述如下:
/m/07s6nbt = text
/m/03gq5hm = font
/m/01n5jq = poster
/m/067408 = album cover
对于这些 MID 为什么在 Knowledge Graph API 中没有返回任何内容,我最初的想法是它们在 Freebase 停产后没有被继承。我了解 Google 提供了 Freebase 的 RDF 转储,但我不确定如何在 Python 中读取该数据并使用它来确定层次结构中中间的深度。
如果无法确定 MID 值的类别级别,则术语拥有的连接数也将是适当的代理。假设更广泛的术语比更精细的术语与其他术语有更多的联系。我发现一篇文章讨论了 MID 的“边缘”数量,我认为这意味着连接数。然而,他们在 MID 值和长值之间进行了一些转换,并使用了各种脚本,这些脚本在 Python 中不断给我带来许多错误。我希望有一个简单的表,其中一列中有 MID 值,另一列中有连接数,但我迷失在他们的代码、转换值和 Python 错误中。
如果您对轻松确定 MID 的连接数量或其层次级别有任何建议,我们将不胜感激。谢谢!