我正在开发一个邮件网关,它会自动为通过它发送的所有电子邮件提供(除其他外)“在浏览器中查看”功能。这就提出了将所有电子邮件存储在某个地方以便可以轻松访问的需求。即使时间段有限,甚至在保存消息之前应用 gzip,我们仍在研究仅保留最近的消息所需的约 500GB 存储空间。
由于所有电子邮件大多相同(除了一些个人变量),我在想是否有更有效的存储方式。对多条记录的重复数据删除的东西,或者类似的东西。对此有何建议?
另一种方法是保存模板,并为每封发送的电子邮件只保存变量,但我们不想这样做,因为这个过程对发件人应该是透明的。这意味着这些信息将无法访问,并且需要事后推断。