我使用的词汇:
nounphrase -- 一个简短的短语,指代特定的人、地点或想法。不同的名词短语的例子包括“Barack Obama”、“Obama”、“Water Bottle”、“Yellowstone National Park”、“Google Chrome web browser”等。
类别——定义哪些名词短语属于它而哪些不属于它的语义概念。类别的示例包括“政客”、“家居用品”、“食品”、“人”、“运动队”等。因此,我们会认为“巴拉克奥巴马”属于“政客”和“人”,但确实不属于“食品”或“运动队”。
我有一个非常庞大的未标记 NLP 数据集,由数百万个名词短语组成。我想使用 Freebase 来标记这些名词短语。我有一个 Freebase 类型到我自己的类别的映射。我需要做的是为我拥有的每一种 Freebase 类型下载每一个示例。
我面临的问题是需要弄清楚如何构建这种类型的查询。在高层次上,查询应该询问 Freebase“主题 XX 的所有示例是什么?” 并且 Freebase 应该以“这里是主题 XX 的所有示例的列表”作为响应。如果有人能给我这个查询的语法,我将不胜感激。如果它可以在 Python 中完成,那就太棒了:)