我一直在处理用神经网络对文本进行分类的问题。我有自己的西班牙语新闻数据集,它被标记为:正面、中立、负面意见。我正在与只有正负的亚马逊极性数据集进行比较。我的模型基于字符级卷积神经网络论文 (Xiang Zhang et al. 2015) 该模型适用于亚马逊数据库,但不适用于我的数据库。它看起来像欠拟合,因为它没有学到任何东西。然后它开始学习,但经过几个小时的训练,它开始过拟合。数据库文本应该如何让神经网络理解?我正在使用带有 NVIDIA DIGITS 的 torch7 进行 GPU 训练。
问问题
221 次