我有一个场景,我需要将某些发件人和线程的电子邮件从 Google Takeoutmbox
存档提取到多页 Google 文档中,这些文档保留富文本/HTML 格式并将整个线程保存到单个文档中。
例如,来自“John Smith”的主题为“X”的所有电子邮件都必须进入一个多页的 Google Docs 文档,该文档从线程中的第一封电子邮件开始,并为每个回复创建一个新页面,直到它们都被捕获到该文档中。同样,必须再次对“John Smith”中的所有其他主题进行此操作。所有这些文档也都放置在 Google Docs 文件夹中的特定文件夹中。
我最初使用mbox 解析方法开始,其中我使用单个主题线程搜索所述用户的所有消息,然后计划将这些消息推送到 Google Doc中,但后来开始思考也许有一些其他更有效的方法来处理这个。
以前有没有人以有效的方式做过类似的事情,你能分享一下对你有用的东西吗?