0

所以我的案例是一个封闭的电子邮件系统。

电子邮件启用了 HTML。

需要什么:
全文搜索(数据库中有超过 100 万封电子邮件,但它们通常是根据最近活跃的用户预先过滤的)
存档 - 我如何存档旧的电子邮件(超过 1-2 年) .

保存这些电子邮件的更好方法是什么?作为服务器上的文件,或数据库表中的文件。还是两者的结合(由于归档)?

在上述问题之后 - 我可以使用哪些特定工具/插件来简化工作。我记得听说过一点 Solr,但我不确定还有哪些其他选择/可能性。

4

1 回答 1

0

Solr 会在搜索方面为您提供帮助,但与存档无关。看看 Solr DIH,有一个 contrib 模块(我认为)可以读取 IMAP 源。

关于存档,那是一个很大的领域……有很多问题你必须回答:

  • 您想将邮件作为一个整体存储,或分解其部分,以便您可以对不同邮件中重复的部分进行重复数据删除。
  • 我倾向于存储在文件系统上,但要注意:
  • 您需要设计一种方法来检测重复数据删除
  • 巧妙地存储在一棵目录树上,这样您就不会减慢每个目录的浏览速度。
  • 需要时压缩(不是较小的或不可压缩的)
于 2012-12-04T08:22:40.207 回答