我正在测试一个想法,即使用回声状态网络的分层组合将任何符号序列矢量化为 R^n 中的固定大小矢量。目标是将这些序列分类为向量(有很多机器学习算法可用于固定大小的实向量)。
特别是,我正在用英语单词测试这个算法,试图将它们分类为名词或形容词。我的数据集在这里:http ://www.ashley-bovan.co.uk/words/partsofspeech.html
使用 SVM 进行分类,我得到 9% 的错误,有人可以指出相关论文或结果进行比较吗?
谢谢!
我正在测试一个想法,即使用回声状态网络的分层组合将任何符号序列矢量化为 R^n 中的固定大小矢量。目标是将这些序列分类为向量(有很多机器学习算法可用于固定大小的实向量)。
特别是,我正在用英语单词测试这个算法,试图将它们分类为名词或形容词。我的数据集在这里:http ://www.ashley-bovan.co.uk/words/partsofspeech.html
使用 SVM 进行分类,我得到 9% 的错误,有人可以指出相关论文或结果进行比较吗?
谢谢!
您如何使用 SVM 进行分类?哪个公式 - c-svm、nu-svm 等?SVM 对其参数非常敏感。你用的是哪个内核?您使用的内核参数是什么?C/nu 的值?
正确的参数将因数据集而异,通常部分数据用于找到内核和参数的最佳组合。错误的组合很容易使您的结果大打折扣。也许您已经这样做了,只是从您所说的内容中不清楚,并且可以产生很大的不同。
几年前,我研究了一种算法,该算法使用马尔可夫链将字符串分类为正确的俄语单词或一些随机字符串(不使用任何字典)。以下是翻译文章的链接:
http://www.begellhouse.com/journals/2b6239406278e43e,685626ff507e6e58,5232ec7f32b362ef.html
我得到了大约 91% 的结果(非常类似于你为你的问题得到的结果,我觉得这很有趣)。在我的研究过程中,我遇到了另一项研究,作者试图将一个短语(至少由三个单词组成的字符串)分类为英语、法语或德语。他们的成功率略低(~80%)。我在互联网上找不到他们工作的链接,但它被称为 - Murray“概率语言建模”