我正在尝试查找与单个单词相关的单词(特别是物理对象)。例如:
网球:网球拍、网球、网球鞋
斯诺克:斯诺克球杆、斯诺克球、粉笔
国际象棋:棋盘、棋子
书柜:书
我曾尝试使用 WordNet,特别是 meronym 语义关系;但是,这种方法并不一致,如下结果所示:
网球:发球、截击、脚误、设定点、回球、优势
斯诺克:没什么
国际象棋:国际象棋移动,棋盘(其自身的meronym关系显示“正方形”和“对角线”)
书柜:搁板
最终将需要对术语进行加权,但现在这并不是一个真正的问题。
有人对如何做到这一点有任何建议吗?
只是更新:最终混合使用了 Jeff 和 StompChicken 的答案。
从 Wikipedia 检索到的信息质量非常好,特别是如何(不出所料)有这么多相关信息(与一些不存在诸如“博客”和“ipod”之类的术语的语料库相比)。
维基百科的结果范围是最好的部分。该软件能够匹配以下术语(为简洁起见,列表被删减):
- 高尔夫:[球、铁、发球台、球包、球杆]
- 摄影:[相机,胶卷,照片,艺术,图像]
- 钓鱼:[鱼,网,钩,陷阱,诱饵,诱饵,竿]
最大的问题是将某些词归类为物理人工制品;默认 WordNet 不是可靠的资源,因为其中不存在许多术语(例如“ipod”,甚至“蹦床”)。