我的朋友有一家小型企业,客户使用电子邮件订购服务。他每天会收到几封电子邮件,整理邮件变得很麻烦。
客户可以请求大约 10 种不同类型的任务,每个任务都有一两个词来指定它。电子邮件中的其他信息是服务的交付地点、时间和相关人员的姓名。该电子邮件还包含一个 ID,一个具有相当标准格式的长数字。
这些电子邮件非常非结构化,但都包含上面的关键信息。我的问题是:扫描这些电子邮件并提取关键信息(例如服务类型、地点、人名、ID 等)的最佳方法是什么?
我考虑过某种预处理,然后通过 AlchemyAPI 传递它,然后使用神经网络为每个功能(关键信息)测试 Alchemy 输出。这可以是监督学习,因为我可以一直做一个反馈循环,因为一旦输入了信息,我就可以有人来验证。
有任何想法吗?谢谢