提供一些上下文:应用程序中的问题记录在 Excel 工作表中,该工作表中的一列包含用户(提出问题的人)和解决团队成员之间的电子邮件通信。还有一堆包含其他有用信息的其他列。我的工作是从这些数据中为企业找到有用的见解。
- 找出那是什么类型的问题?例如,是用户培训问题还是访问问题等。这意味着我分析邮件文本并通过某种方式找出问题的类型。
- 一个问题发生了多少次电子邮件对话?
- 是重复的问题吗?
- 还有其他简单的统计问题,例如每周有多少问题等......
我读到 NLP with Python 可以解决我的问题。我也同样查看了 Rapidminer。
现在我的问题是一个。“我在正确的轨道上吗?NLP(自然语言处理)是解决这些问题的方法吗?” 湾。如果是,那么如何开始.. 我已经开始阅读有关 Python 的 NLP 书籍,但那是巨大的,我应该专注于哪些特定领域并可以开始我的分析?C。Rapidminer 工具如何?它能回答所有这些问题吗?数据量不是很大(可能100000行)...看起来在rapidminer中建立一个进程很容易,因此开始它...
感谢任何建议!!!