问题标签 [mbox]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
684 浏览

mbox - 按发件人拆分大型 mbox

我正在寻找一种将非常大的 mbox 文件拆分为多个 mbox 文件(每个发件人一个)的方法。

或者,仅提取指定发件人的消息。

在互联网上上下查找,但没有找到任何(或使用错误的搜索词)。

0 投票
1 回答
413 浏览

java - 使用正则表达式解析 mbox 中的邮件

我想基于正则表达式和java技术获取以下信息,其中开始标签是“FROM mail@mail.com Time”,结束标签是“FROM mail@mail.com Time”或字符串的结尾。结果应仅包含开始标记和开始和结束标记之间的内容,但不包含结束标记。背景是我想用正则表达式获取 mbox 格式的电子邮件。开始标记为“FROM mail@mail.com 时间”,邮件的结尾是下一封邮件的开头或文件的结尾。

所以我有以下架构:

我的代码:

我用过这个,但它不起作用。有人可以支持我吗?提前致谢。

0 投票
4 回答
8584 浏览

bash - 如何使用终端将 mbox 文件拆分为 n-MB 大块?

所以我已经通读了这个关于 SO 的问题,但它对我没有任何帮助。我想将 Gmail 生成的 mbox 文件导入另一个网络邮件服务,但问题是每次导入它只允许 40 MB 大文件。

所以我不得不以某种方式将 mbox 文件拆分为 max. 40 MB 大文件,一个接一个地导入。你会怎么做?

formail我最初的想法是使用另一个脚本(

我也查看了split命令,但我担心它会切断邮件。谢谢你的帮助!

0 投票
2 回答
3633 浏览

python - 使用 Python 邮箱模块保存 IMAP 消息

我正在将 IMAP 中的消息下载imaplib到 mbox(带mailbox模块)中:

让我们下载 UID = 的邮件1 .. 1000。下一次,我想从第 1001 条消息开始,而不是从第 1 条开始。但是,mailbox.mbox 不存储UIDanywre。所以下次我打开 mbox 文件时,就不可能知道我们停在哪里了。

该模块是否有一种自然的方式mailbox来存储UID电子邮件?

或者也许我不应该使用mailbox+imaplib的方式?

0 投票
0 回答
531 浏览

bash - 随着字符串变量的增长,bash脚本太慢了

输入文件 ($1) 是一个 mbox 文件(它是一个文本文件)。这个想法是从头开始阅读它,在 $message 中保存一条消息,用它做一些事情,丢弃它并重新开始。现在的问题是消息越大,脚本越慢。脚本在达到 10mb 消息时总是挂起,我计算出至少需要 20 分钟。

您只需评论该行

并且在一分钟内脚本完成了一个 120mb 的 mbox 文件。期望一个变量保持几个 mb 是不是很糟糕?谢谢你们

0 投票
1 回答
2367 浏览

awk - 如何使用 awk 或 grep 从标题中提取电子邮件字段

关于:邮箱(mbox 格式)电子邮件信息

多消息文件: Inbox.mbox

所需的模式匹配顺序;

期望的最终结果;

目标;
* "Inbox.mbox" 中的每封邮件消息都以 "From" 开头
* 仅匹配 "^Date: |^From |^From: |^To: |^Message-Id: |^Subject: "的第一次出现,打印那条线。
* 以分号分隔的 csv 格式输出结果

我试过了;
grep -a -E -i "^Date: |^From |^From: |^To: |^Message-ID: |^Subject: " Inbox.mbox
awk '/^Date: / || /^From / || /^From: / || /^To: / || /^Message-ID: / || /^Subject: /' Inbox.mbox

评论:上面给了我一个好的开始,我最熟悉 awk 和 grep 所以我只尝试使用它们。难以按我希望的顺序打印出行,匹配第一次出现仅以换行符结尾。一些消息中存在二进制数据,所以我使用 -a 和 grep。

任何帮助将不胜感激。
谢谢你。

0 投票
0 回答
219 浏览

ruby - 如何将 Google Takeout MBOX 电子邮件提取到 Google Docs 中?

我有一个场景,我需要将某些发件人和线程的电子邮件从 Google Takeoutmbox存档提取到多页 Google 文档中,这些文档保留富文本/HTML 格式并将整个线程保存到单个文档中。

例如,来自“John Smith”的主题为“X”的所有电子邮件都必须进入一个多页的 Google Docs 文档,该文档从线程中的第一封电子邮件开始,并为每个回复创建一个新页面,直到它们都被捕获到该文档中。同样,必须再次对“John Smith”中的所有其他主题进行此操作。所有这些文档也都放置在 Google Docs 文件夹中的特定文件夹中。

我最初使用mbox 解析方法开始,其中我使用单个主题线程搜索所述用户的所有消息,然后计划将这些消息推送到 Google Doc中,但后来开始思考也许有一些其他更有效的方法来处理这个。

以前有没有人以有效的方式做过类似的事情,你能分享一下对你有用的东西吗?

0 投票
1 回答
471 浏览

python - python,减少内存消耗并使这段代码更高效?

我已经编写了这段代码(它有效 - 我在小批量的 MBOX 文件上尝试过)。但是,当我在一个大小为 2.9 GB、大约 50,000 封邮件的 MBOX 文件上尝试它时,内存消耗猛增,导致计算机无法使用。这段代码在内存消耗方面有什么问题,有没有办法解决它,例如使代码处理增量而不是整体? 此脚本的目标是生成一个 CSV 文件,其中 x 作为日期,Y 作为每个日期收到的消息计数,以便绘制它们并生成电子邮件的统计表示。 未来: 我打算扩展它,阅读电子邮件并按时间顺序在 pdf 上生成输出,因此需要对其进行排序(内存消耗猛增)

0 投票
1 回答
163 浏览

php - 在 Zend Mail 中以 mbox 格式从 Gmail 获取电子邮件

我正在使用 Zend Mail 进行电子邮件项目。我已成功获取所有包含电子邮件和附件的 Gmail 文件夹。但我不知道如何将电子邮件下载为 mbox 格式?我需要使用文件处理来创建 mbox 还是有另一种方法可以将电子邮件下载为 mbox 格式?

0 投票
1 回答
724 浏览

java - 如何使用 Java JavaMail 创建 mbox?

如何使用 IMAP 协议和 JavaMail 读取邮件收件箱,然后使用本地磁盘存储邮件。没有 mstor 的文档。我尝试这种方式,但似乎 MStorStore 只是读取本地 mbox,而不是根据在 connect() 函数中作为参数传递的外部服务器创建和更新它。我收到错误:文件夹 [收件箱] 不存在。

问题是如何从 javax.mail.Store 创建 MBox,我可以使用 Mstor 读取和更新。