问题标签 [email-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4926 浏览

php - 如何在 php 中解析 .msg 文件?

有没有办法在 PHP 中解析 Outlook .msg 文件?我的要求是解析一个 .msg 文件并将其中的每个对话(消息)转换为单独的文件(最好是 .eml 文件)。

0 投票
1 回答
229 浏览

regex - 用于解析电子邮件的 Posix RegEx - 如何在第一次出现边界后停止

我正在研究 MIME 格式的电子邮件解析器。我被迫使用用 C 编写的“posix regex”库,我想知道它的行为。

假设我们有以下部分电子邮件:

现在我需要获取不同类型的消息(纯文本和 html)。我使用以下模式来获取边界之间的数据:

这种模式在一些 RegEx 库中运行良好。例如,当我在 javascript 中编写相同的正则表达式过程时,我能够毫无问题地获取这两个部分的消息。

但是,“posix regex”库会在最后返回整个消息,不包括“--”。这是它的结果:

为什么在普通消息后找到第一次出现边界后它没有停止?我错过了什么吗?

0 投票
1 回答
2101 浏览

python - 将电子邮件文本拆分为对话

我正在用 Python 编写一个电子邮件解析器,并寻找一种方法来从电子邮件正文中提取所有以前的电子邮件(转发、回复)。该脚本必须支持尽可能多的电子邮件客户端(gmail、outlook、iphone 等)。例如,如果身体是:

结果应该是一个包含 3 个条目的数组,每个条目包含电子邮件文本和尽可能多的元数据(日期、发件人、主题等)。

是否有任何标准/现代方法可以实现这一目标?是否有来自不同客户的响应的维护列表?我已经搜索过类似的问题,但到目前为止还没有令人满意的答案。

0 投票
1 回答
943 浏览

php - 有内容配置时如何提取邮件正文?

有内容配置时如何提取邮件正文?

标题1

标头2:

当我签署邮件并发送时,邮件的标题格式为“header1”,当我发送邮件而不签名时,邮件的标题格式为“header2”..

我目前正在使用" getMessageBody()" methodmimemailparser.class.php文件中提取消息的正文..

在签名邮件上,我无法检索邮件正文,它在使用时返回空正文"getmessagebody()" method,但在未签名邮件上,它能够检索邮件正文..

在检查已签名和未签名的邮件标题时,有区别,如何在已签名邮件(header1)上提取邮件正文?

0 投票
0 回答
43 浏览

email - 我在哪里可以获得大量 HTML 电子邮件回复以进行测试?

我想尝试开发一个解析 HTML 电子邮件回复的库。为了进行测试,我需要大量 HTML 电子邮件回复(来自不同的电子邮件客户端,使用不同的语言)。获取此类测试内容的最佳方式是什么?

我查看了公共邮件列表档案(包括 Google 群组),但其中许多服务只允许基于文本的电子邮件。

有任何想法吗?

0 投票
2 回答
641 浏览

java - 使用 java 删除电子邮件页脚和标志

嗨,有人可以告诉如何从邮件中删除页脚。我只需要存储电子邮件的正文并删除其他内容,无论是免责声明还是页脚。

0 投票
1 回答
1167 浏览

java - 使用 Java 从引用的回复中解析电子邮件内容

我正在尝试找出一种方法来过滤掉电子邮件中引用或回复的文本。我使用了 Jsoup 和解析器回调。但它不能可靠地过滤掉电子邮件文本

这是我的方法,但它不适用于所有情况,如提到的:Convert formatted email (HTML) to plain Text?

0 投票
1 回答
732 浏览

email - 解析 mime 电子邮件、outlook 问题和差异

我正在学习一个名为 parsec 的 haskell 解析库,为此我需要解析一封电子邮件。我一直在研究规格,比较来自不同客户的不同消息,阅读一些 rfc 等。

对于这个练习,我只需要提取“From:”标题和实际的纯文本正文。现在,所有客户似乎都产生了关于规格的理智或至少没有偏差的消息。唯一的区别是前景(出于某种原因,我并不感到惊讶)。

所以根据myu阅读的标准方法是有一个边界序列说:

然后多部分体的所有部分都由这个边界序列分隔,对吗?如果我错了,请纠正我。我希望我的解析器与所有可能的客户一起工作。

所以常见的模式是

现在,查看 Outlook 生成的消息,我看到了不同的画面。它使用某种子边界,我不明白它是否是标准?这是前景变体

然后身体是这样划定的

所以它有一个与序列 001 的外边界,然后是与序列 002 的内边界。那么这是什么?这是某种微软自己的 mime 规范,还是我错过的 rfc?这更难解析。

0 投票
0 回答
1863 浏览

php - 将 mailparse 扩展安装到 php

我想为 php 安装 mailparse 扩展(os 是 windows,php 版本 5.2)。我使用 EasyPhp。

我复制php_mailparse.dllext文件夹,然后添加extension=php_mailparse.dllphp.ini文件中。但我得到错误

找不到 mail_parse.dll 指定的模块。

这里有什么问题?

0 投票
1 回答
2548 浏览

email-parsing - 使用 PHP mime 邮件解析器

我正在使用这个库来解析我收到的电子邮件: http ://code.google.com/p/php-mime-mail-parser/

我安装了 Mailparse 扩展,一切都很好,但是当我这样做时:

它回显了name电子邮件发件人的地址,例如:John Smith,但我需要email电子邮件发件人的地址,例如john@smith.com

这也发生在:

而且我似乎找不到任何解决方案来获得这些,这里有什么帮助吗?谢谢在adnva