问题标签 [mbox]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mbox - 按发件人拆分大型 mbox
我正在寻找一种将非常大的 mbox 文件拆分为多个 mbox 文件(每个发件人一个)的方法。
或者,仅提取指定发件人的消息。
在互联网上上下查找,但没有找到任何(或使用错误的搜索词)。
java - 使用正则表达式解析 mbox 中的邮件
我想基于正则表达式和java技术获取以下信息,其中开始标签是“FROM mail@mail.com Time”,结束标签是“FROM mail@mail.com Time”或字符串的结尾。结果应仅包含开始标记和开始和结束标记之间的内容,但不包含结束标记。背景是我想用正则表达式获取 mbox 格式的电子邮件。开始标记为“FROM mail@mail.com 时间”,邮件的结尾是下一封邮件的开头或文件的结尾。
所以我有以下架构:
我的代码:
我用过这个,但它不起作用。有人可以支持我吗?提前致谢。
bash - 如何使用终端将 mbox 文件拆分为 n-MB 大块?
所以我已经通读了这个关于 SO 的问题,但它对我没有任何帮助。我想将 Gmail 生成的 mbox 文件导入另一个网络邮件服务,但问题是每次导入它只允许 40 MB 大文件。
所以我不得不以某种方式将 mbox 文件拆分为 max. 40 MB 大文件,一个接一个地导入。你会怎么做?
formail
我最初的想法是使用另一个脚本(
我也查看了split
命令,但我担心它会切断邮件。谢谢你的帮助!
python - 使用 Python 邮箱模块保存 IMAP 消息
我正在将 IMAP 中的消息下载imaplib
到 mbox(带mailbox
模块)中:
让我们下载 UID = 的邮件1 .. 1000
。下一次,我想从第 1001 条消息开始,而不是从第 1 条开始。但是,mailbox.mbox
不存储UID
anywre。所以下次我打开 mbox 文件时,就不可能知道我们停在哪里了。
该模块是否有一种自然的方式mailbox
来存储UID
电子邮件?
或者也许我不应该使用mailbox
+imaplib
的方式?
bash - 随着字符串变量的增长,bash脚本太慢了
输入文件 ($1) 是一个 mbox 文件(它是一个文本文件)。这个想法是从头开始阅读它,在 $message 中保存一条消息,用它做一些事情,丢弃它并重新开始。现在的问题是消息越大,脚本越慢。脚本在达到 10mb 消息时总是挂起,我计算出至少需要 20 分钟。
您只需评论该行
并且在一分钟内脚本完成了一个 120mb 的 mbox 文件。期望一个变量保持几个 mb 是不是很糟糕?谢谢你们
awk - 如何使用 awk 或 grep 从标题中提取电子邮件字段
关于:邮箱(mbox 格式)电子邮件信息
多消息文件: Inbox.mbox
所需的模式匹配顺序;
期望的最终结果;
目标;
* "Inbox.mbox" 中的每封邮件消息都以 "From" 开头
* 仅匹配 "^Date: |^From |^From: |^To: |^Message-Id: |^Subject: "的第一次出现,打印那条线。
* 以分号分隔的 csv 格式输出结果
我试过了;
grep -a -E -i "^Date: |^From |^From: |^To: |^Message-ID: |^Subject: " Inbox.mbox
awk '/^Date: / || /^From / || /^From: / || /^To: / || /^Message-ID: / || /^Subject: /' Inbox.mbox
评论:上面给了我一个好的开始,我最熟悉 awk 和 grep 所以我只尝试使用它们。难以按我希望的顺序打印出行,匹配第一次出现仅以换行符结尾。一些消息中存在二进制数据,所以我使用 -a 和 grep。
任何帮助将不胜感激。
谢谢你。
ruby - 如何将 Google Takeout MBOX 电子邮件提取到 Google Docs 中?
我有一个场景,我需要将某些发件人和线程的电子邮件从 Google Takeoutmbox
存档提取到多页 Google 文档中,这些文档保留富文本/HTML 格式并将整个线程保存到单个文档中。
例如,来自“John Smith”的主题为“X”的所有电子邮件都必须进入一个多页的 Google Docs 文档,该文档从线程中的第一封电子邮件开始,并为每个回复创建一个新页面,直到它们都被捕获到该文档中。同样,必须再次对“John Smith”中的所有其他主题进行此操作。所有这些文档也都放置在 Google Docs 文件夹中的特定文件夹中。
我最初使用mbox 解析方法开始,其中我使用单个主题线程搜索所述用户的所有消息,然后计划将这些消息推送到 Google Doc中,但后来开始思考也许有一些其他更有效的方法来处理这个。
以前有没有人以有效的方式做过类似的事情,你能分享一下对你有用的东西吗?
python - python,减少内存消耗并使这段代码更高效?
我已经编写了这段代码(它有效 - 我在小批量的 MBOX 文件上尝试过)。但是,当我在一个大小为 2.9 GB、大约 50,000 封邮件的 MBOX 文件上尝试它时,内存消耗猛增,导致计算机无法使用。这段代码在内存消耗方面有什么问题,有没有办法解决它,例如使代码处理增量而不是整体? 此脚本的目标是生成一个 CSV 文件,其中 x 作为日期,Y 作为每个日期收到的消息计数,以便绘制它们并生成电子邮件的统计表示。 未来: 我打算扩展它,阅读电子邮件并按时间顺序在 pdf 上生成输出,因此需要对其进行排序(内存消耗猛增)
php - 在 Zend Mail 中以 mbox 格式从 Gmail 获取电子邮件
我正在使用 Zend Mail 进行电子邮件项目。我已成功获取所有包含电子邮件和附件的 Gmail 文件夹。但我不知道如何将电子邮件下载为 mbox 格式?我需要使用文件处理来创建 mbox 还是有另一种方法可以将电子邮件下载为 mbox 格式?
java - 如何使用 Java JavaMail 创建 mbox?
如何使用 IMAP 协议和 JavaMail 读取邮件收件箱,然后使用本地磁盘存储邮件。没有 mstor 的文档。我尝试这种方式,但似乎 MStorStore 只是读取本地 mbox,而不是根据在 connect() 函数中作为参数传递的外部服务器创建和更新它。我收到错误:文件夹 [收件箱] 不存在。
问题是如何从 javax.mail.Store 创建 MBox,我可以使用 Mstor 读取和更新。