问题标签 [email-parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 如何在 php 中解析 .msg 文件?
有没有办法在 PHP 中解析 Outlook .msg 文件?我的要求是解析一个 .msg 文件并将其中的每个对话(消息)转换为单独的文件(最好是 .eml 文件)。
regex - 用于解析电子邮件的 Posix RegEx - 如何在第一次出现边界后停止
我正在研究 MIME 格式的电子邮件解析器。我被迫使用用 C 编写的“posix regex”库,我想知道它的行为。
假设我们有以下部分电子邮件:
现在我需要获取不同类型的消息(纯文本和 html)。我使用以下模式来获取边界之间的数据:
这种模式在一些 RegEx 库中运行良好。例如,当我在 javascript 中编写相同的正则表达式过程时,我能够毫无问题地获取这两个部分的消息。
但是,“posix regex”库会在最后返回整个消息,不包括“--”。这是它的结果:
为什么在普通消息后找到第一次出现边界后它没有停止?我错过了什么吗?
python - 将电子邮件文本拆分为对话
我正在用 Python 编写一个电子邮件解析器,并寻找一种方法来从电子邮件正文中提取所有以前的电子邮件(转发、回复)。该脚本必须支持尽可能多的电子邮件客户端(gmail、outlook、iphone 等)。例如,如果身体是:
结果应该是一个包含 3 个条目的数组,每个条目包含电子邮件文本和尽可能多的元数据(日期、发件人、主题等)。
是否有任何标准/现代方法可以实现这一目标?是否有来自不同客户的响应的维护列表?我已经搜索过类似的问题,但到目前为止还没有令人满意的答案。
php - 有内容配置时如何提取邮件正文?
有内容配置时如何提取邮件正文?
标题1
标头2:
当我签署邮件并发送时,邮件的标题格式为“header1”,当我发送邮件而不签名时,邮件的标题格式为“header2”..
我目前正在使用" getMessageBody()" method
从mimemailparser.class.php
文件中提取消息的正文..
在签名邮件上,我无法检索邮件正文,它在使用时返回空正文"getmessagebody()" method
,但在未签名邮件上,它能够检索邮件正文..
在检查已签名和未签名的邮件标题时,有区别,如何在已签名邮件(header1)上提取邮件正文?
email - 我在哪里可以获得大量 HTML 电子邮件回复以进行测试?
我想尝试开发一个解析 HTML 电子邮件回复的库。为了进行测试,我需要大量 HTML 电子邮件回复(来自不同的电子邮件客户端,使用不同的语言)。获取此类测试内容的最佳方式是什么?
我查看了公共邮件列表档案(包括 Google 群组),但其中许多服务只允许基于文本的电子邮件。
有任何想法吗?
java - 使用 java 删除电子邮件页脚和标志
嗨,有人可以告诉如何从邮件中删除页脚。我只需要存储电子邮件的正文并删除其他内容,无论是免责声明还是页脚。
java - 使用 Java 从引用的回复中解析电子邮件内容
我正在尝试找出一种方法来过滤掉电子邮件中引用或回复的文本。我使用了 Jsoup 和解析器回调。但它不能可靠地过滤掉电子邮件文本
这是我的方法,但它不适用于所有情况,如提到的:Convert formatted email (HTML) to plain Text?
email - 解析 mime 电子邮件、outlook 问题和差异
我正在学习一个名为 parsec 的 haskell 解析库,为此我需要解析一封电子邮件。我一直在研究规格,比较来自不同客户的不同消息,阅读一些 rfc 等。
对于这个练习,我只需要提取“From:”标题和实际的纯文本正文。现在,所有客户似乎都产生了关于规格的理智或至少没有偏差的消息。唯一的区别是前景(出于某种原因,我并不感到惊讶)。
所以根据myu阅读的标准方法是有一个边界序列说:
然后多部分体的所有部分都由这个边界序列分隔,对吗?如果我错了,请纠正我。我希望我的解析器与所有可能的客户一起工作。
所以常见的模式是
现在,查看 Outlook 生成的消息,我看到了不同的画面。它使用某种子边界,我不明白它是否是标准?这是前景变体
然后身体是这样划定的
所以它有一个与序列 001 的外边界,然后是与序列 002 的内边界。那么这是什么?这是某种微软自己的 mime 规范,还是我错过的 rfc?这更难解析。
php - 将 mailparse 扩展安装到 php
我想为 php 安装 mailparse 扩展(os 是 windows,php 版本 5.2)。我使用 EasyPhp。
我复制php_mailparse.dll
到ext
文件夹,然后添加extension=php_mailparse.dll
到php.ini
文件中。但我得到错误
找不到 mail_parse.dll 指定的模块。
这里有什么问题?
email-parsing - 使用 PHP mime 邮件解析器
我正在使用这个库来解析我收到的电子邮件: http ://code.google.com/p/php-mime-mail-parser/
我安装了 Mailparse 扩展,一切都很好,但是当我这样做时:
它回显了name
电子邮件发件人的地址,例如:John Smith
,但我需要email
电子邮件发件人的地址,例如john@smith.com
。
这也发生在:
而且我似乎找不到任何解决方案来获得这些,这里有什么帮助吗?谢谢在adnva