0

提供一些上下文:应用程序中的问题记录在 Excel 工作表中,该工作表中的一列包含用户(提出问题的人)和解决团队成员之间的电子邮件通信。还有一堆包含其他有用信息的其他列。我的工作是从这些数据中为企业找到有用的见解。

  1. 找出那是什么类型的问题?例如,是用户培训问题还是访问问题等。这意味着我分析邮件文本并通过某种方式找出问题的类型。
  2. 一个问题发生了多少次电子邮件对话?
  3. 是重复的问题吗?
  4. 还有其他简单的统计问题,例如每周有多少问题等......

我读到 NLP with Python 可以解决我的问题。我也同样查看了 Rapidminer。

现在我的问题是一个。“我在正确的轨道上吗?NLP(自然语言处理)是解决这些问题的方法吗?” 湾。如果是,那么如何开始.. 我已经开始阅读有关 Python 的 NLP 书籍,但那是巨大的,我应该专注于哪些特定领域并可以开始我的分析?C。Rapidminer 工具如何?它能回答所有这些问题吗?数据量不是很大(可能100000行)...看起来在rapidminer中建立一个进程很容易,因此开始它...

感谢任何建议!!!

4

1 回答 1

0

试试xlrd Python Module 来读取和处理 Excel 表格。我认为使用此模块的适当实现是解决您的问题的简单方法。

于 2013-09-20T06:52:16.013 回答