I've got a training DataSet and a Test DataSet. How can we experiment and get results ? Can WEKA be used for the same ?

The topic is Word Sense Disambiguation using Support Vector Machine Supervised learning Approach

The Document types within both the sets include following file types: 1. 2 XML files 2. README file 3. SENSEMAP format 4. TRAIN format 5. KEY format 6. WORDS format


1 回答 1


像 SVM 这样的机器学习方法在词义消歧方面并不流行。
你知道Wikiify 吗,映射到维基百科可以被认为是非常精细的词义消歧。
在这种情况下回答您的问题;任何机器学习技术都可以给你想要的结果。人们应该更担心要提取的特征,并确保单词特征足够独特,可以在您选择的级别解决歧义。例如在句子中:Wish you a very Happy Christamas您只想消除Happy Christmas书籍或节日的歧义。

于 2014-11-11T19:07:17.943 回答