8

虽然我拥有 EE 背景,但我没有机会参加自然语言处理课程。

我想为土耳其语构建情绪分析工具。我认为最好创建一个土耳其语 wordnet 数据库,而不是将文本翻译成英文,然后使用提供的工具用错误的翻译文本对其进行分析。(是吗?

那么你们建议我做什么?首先从公开课程网站上学习 NLP 课程?我真的不知道从哪里开始。你能帮助我,也许可以为我提供分步指南吗?我知道这是一个学术项目,但我有兴趣在该领域培养技能作为业余爱好。

提前致谢。

4

1 回答 1

6

这是我之前使用过的过程(制作日文、中文、德文和阿拉伯文语义网络):

  1. 收集至少两本英语/土耳其语词典。它们必须是独立的,而不是相互派生的。您可以使用 Wikipedia 自动生成您的字典之一。如果您需要发布您的网络,那么您可能需要开源词典、许可费或律师。
  2. 使用这些词典翻译英语 Wordnet,生成每个同义词集的置信度等级。
  3. 保留那些有强烈信心的人,通过中等或低信心的人手动批准或修复。
  4. 手动完成

我在 2008 年论文的“WordNet 的自动翻译”部分对此进行了扩展:http: //dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

(对于土耳其情感词典的既定目标,还有其他方法,不涉及语义网络。例如,刘冰的“语义分析和意见挖掘”是一个很好的研究综述。但是语义网络方法将,恕我直言,从长远来看,总是会产生更好的结果,并且还有很多其他用途。)

于 2013-11-06T04:01:27.217 回答