5

什么代表词义消歧 (WSD) 软件的最新技术?哪些指标决定了最先进的技术,哪些工具包/开源包可用?

4

1 回答 1

12

我的清单并不详尽,但谷歌搜索更多内容肯定会更好地满足您的目的。

对于软件,这里有一个简短的列表,记得引用相关来源!!!

GWSD:基于图的无监督词义消歧 http://lit.csci.unt.edu/~rada/downloads/GWSD/GWSD.1.0.tar.gz

SenseLearner:全词词义消歧工具 http://lit.csci.unt.edu/~rada/downloads/senselearner/SenseLearner2.0.tar.gz

KYOTO UKB 基于图形的 WSD http://ixa2.si.ehu.es/ukb/

pyWSD:简单 WSD 算法的 Python 实现 https://github.com/alvations/pywsd


WSD 任务在某种程度上也依赖于数据源,所以这里有一些,记得也要引用它们!!!

Open Mind Word Expert Sense 标记数据 http://teach-computers.org/word-expert.html

TWA Sense 标记数据 http://lit.csci.unt.edu/~rada/downloads/TWA/TWA.tar.gz

SemCor http://lit.csci.unt.edu/~rada/downloads/semcor/semcor1.6.tar.gz


最后,WSD 任务依赖于一些预处理,如果您正在研究最先进的跨语言 WSD,那么您应该尝试寻找单词级别的对齐器,例如

  • 摩西
  • MGIZA++
  • 吉萨++
  • 伯克利对准器

此外,查看之前的 Senseval/SemEval 页面,了解已经完成的工作,以及未来任务的发展趋势。http://en.wikipedia.org/wiki/SemEval

于 2012-01-10T19:03:47.373 回答