问题标签 [mbox]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
471 浏览

python - Decode and access mbox file with mbox Python mdule

I need to migrate an email database to a CRMand have 2 problems:

I get to access the mbox file but the content is not properly decoded.

I want to create a dataframe like structure with following columns: "date, from, to, subject, body"

I have tried the following:

and get the following output:

0 投票
1 回答
215 浏览

linux - 如何从包含许多电子邮件的 mbox(电子邮件)文件中提取所有电子邮件标头和仅标头?

如何从包含许多电子邮件的mbox(电子邮件)文件中提取所有电子邮件标头和仅标头?

0 投票
0 回答
42 浏览

python-3.x - 将邮箱代码从 Python 2 移植到 Python 3 - mbx.add() 的问题

我有一个简单的电子邮件过滤程序,多年来一直在 Python 2 中令人满意地工作,我正在尝试将其转换为 Python 3。只要没有“扩展”,它就可以在 Python 3 中运行(即消息中的非 ASCII) 字符,但如果我调用 mbx.add() 失败并出现以下错误:-

主程序简单地从标准输入(通过.forward)读取传入的消息,并将其变成一条消息:-

然后将其传递到本地 mbox 文件:-

mbx的一个实例在哪里mailbox.mbox

那么我应该怎么做才能让它在 Python 3 中工作,我需要在某个地方进行显式编码和解码还是什么?

0 投票
2 回答
309 浏览

python - 使用邮箱访问 mbox 中的所有字段

我正在尝试对 mbox 格式的电子邮件进行一些处理。

搜索后,尝试了一些试验和错误https://docs.python.org/3/library/mailbox.html#mbox

我已经使用下面列出的测试代码完成了我想要的大部分工作(即使我必须编写代码来解码主题)。

我发现这有点偶然,特别是查找“主题”字段所需的关键似乎是反复试验,我似乎找不到任何方法来列出消息的候选人。(我了解这些字段可能因电子邮件而异。)

谁能帮我列出可能的值?

我还有一个问题;电子邮件可能包含许多“已接收:”字段,例如

我有兴趣按时间顺序访问第一个 - 我很乐意搜索,但似乎找不到任何方法来访问文件中的第一个。

基于这个答案,我简化了主题解码,并得到了类似的结果。

我仍在寻找访问标头其余部分的建议 - 特别是如何访问多个“已接收:”字段。

0 投票
2 回答
97 浏览

awk - 使用 sed/awk 修复损坏的 mbox 文件

我有一堆旧的、继承的 mbox 文件,我想将它们转换为 maildir。问题:mbox 不完全符合 RFC。在某些(但不是全部)邮件中,有几个邮箱在“^From”行之前缺少空行,这导致 mb2md 无法将这些邮件彼此分开。

例子:

现在我正在寻找一种简单的方法来在任何匹配“^From”的行之前插入一个空行——但前提是前面没有空行。一种流编辑是必须的,因为邮箱可能真的很大。

我经常使用 sed - 但我不熟悉多行匹配。今天尝试了几件事(修改后的剪切),但没有成功:(

最后一次尝试是 sed -E ':a;N;$!ba;s/\n(..*)\nFrom /\n\1\n\nFrom /g' /tmp/testfile

只匹配模式的最后一次出现!?

sed/awk-experts - 你对我有什么提示吗?

0 投票
0 回答
305 浏览

python - 如何使用 Python 将电子邮件从 MBOX 转换为 EML

有没有办法使用 Python 将一些 MBOX 文件转换为单个 EML 文件?

我有一个客户从 GMail 下载他的电子邮件作为 MBOX 集合。但我需要将它们转换为单独的 EML 文件,以便我可以将它们上传到他的新电子邮件客户端/服务器——它不接受 MBOX 文件。

提前感谢您的任何反馈。

更新:我还没有代码。我想知道是否甚至可以通过一个小应用程序来做到这一点,如果没有,我会购买其中一个在线可用的。只是觉得自己先尝试一下会很酷。

另外,据我了解,mbox 是电子邮件(.eml 文件)的集合,而单个电子邮件只是一个 .eml 文件。

0 投票
0 回答
190 浏览

python - 如何使用 python 将 mbox 转换为 csv 格式?

我正在写使用 Python 3 将电子邮件 Mbox 格式转换为 CSV

这是我得到的错误。

类型错误:序列项 0:预期的 str 实例,找到列表

我非常感谢您能提供的任何帮助。

0 投票
1 回答
89 浏览

python - 从 mbox 写入 html 文件

在 Yahoo 群组关闭之前,您可以将群组的内容下载到 mbox 文件中。我正在尝试将 mbox 文件转换为一系列 html 文件 - 每条消息一个。我的问题是处理 html 中的编码和特殊字符。这是我的尝试:

消息的内容在撇号和其他特殊字符之前有反斜杠,如下所示:

星级,目前适用于 \xa311.99 [理想的圣诞礼物]。广告结束-Seroiusly,如果您在小船上没有一本像样的书

我的问题是,获取电子邮件内容并将其写入具有正确字符的 html 文件的最佳方法是什么。我不能成为第一个遇到这个问题的人。

0 投票
0 回答
72 浏览

python - 如何使用python合并两个mbox文件

我有两个 mbox 文件,我需要将它们合并、合并或合并到一个 mbox 文件中。

我尝试了一个 for 循环,将消息拉入一个主列表,但不确定这是否是最好的方法,因为我现在有两个可以组合的列表,但需要一个最终的 mbox 文件(我想)。我计划再次将合并的 mbox 文件分解为一个数据框,我已经为一个 mbox 文件完成了该操作。

到目前为止,这是我所拥有的:

任何帮助,将不胜感激。提前致谢!

0 投票
1 回答
133 浏览

c# - 导航 MimeKit.MimeParser

是否可以使用 MimeKit.MimeParser 从 mbox 文件中读取第 M 条消息的第 N 个附件?就我而言,我会将少量消息(每个消息的几个字段,包括附件列表)存储到内存数据结构中,之后,我希望能够返回到特定的消息附件并阅读其内容。

到目前为止我尝试过的事情:

  • 记住每条读取消息的底层流位置并将流定位到该位置,然后再调用 _parser.ParseMessage() 以获取消息及其附件。
  • 我还尝试使用 LINQ 方法通过 MessageID 获取消息,并结合将流位置设置为 0 并再次调用 SetStream 而没有它。

以上不起作用。

这里有一些代码只是为了说明我的努力: