0

我的项目的目的是窥探收到的会议、约会、时间间隔等的电子邮件消息。一旦我有了具体的内容,我想更新用户的日历。

现在,检索消息和更新日历的基本任务可以使用 Google Apps 脚本完成。

我的查询:因为 CRF 库仅在 C++、Java 而不是 JavaScript 中可用。因此,我需要离线访问这些消息。我怎么做?

PS:任何关于如何推进这个想法的建议都将不胜感激。

4

1 回答 1

0

如果我理解正确,您有分类问题信息检索问题。¹

首先,您想知道收到的邮件是会议/约会还是其他(两个类别)。这可以通过所谓的朴素贝叶斯过滤来完成。这是一种用于对邮件进行分类的概率方法。它本质上需要一组特征并计算这封邮件既是会议又是不同的概率。它背后的理论是基于贝叶斯规则(概率论),因此得名。

第二步是在邮件中查找时间。这将是文本挖掘的任务,不幸的是我还不是很擅长。因此我不能告诉你最好的方法,但一个非常简单的方法是:

鉴于您已经知道这封邮件是一封会议邮件,其中应该有一个时间戳。因此,使用正则表达式作为时间戳并扫描邮件。获取第一个时间戳并将其添加到日历中。不幸的是,这可能会导致相当多的错误。

我希望我能够给你一个关于你在这里讨论的领域的小概述。如果您有兴趣,我可以添加更多关于贝叶斯的信息(例如计算)。只需发表评论以防万一。

¹我不确定是否真的是这样,您还没有回答评论。也有可能,你需要一些方法来下载已经分类的邮件......

于 2013-06-06T20:16:28.010 回答