问题标签 [email-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
557 浏览

php - 提取邮件正文 - 当有附件时

我需要在 php 中提取邮件的正文。

目前我正在使用 mimemailparser "getmessagebody" 函数来检索邮件正文。

它在没有任何其他 (.msg) 文件的邮件有附件时运行良好,但如果邮件包含的附件​​也是 .msg 格式的邮件,它会获取附件的正文而不是正文当前邮件。使用以下函数和代码。

代码:

问题:getmessagebody 检索附加邮件的正文,而不是原始邮件。请问有什么解决办法吗?

0 投票
2 回答
6876 浏览

php - 如何使用 IMAP 阅读 Rediffmail 和 hotmail

我正在尝试使用 PHP IMAP 访问所有未读的 rediff 和 hotmail 电子邮件。我正在尝试使用 imap.live.com:995/imap/ssl 作为 rediffmail 的主机名,但它失败并出现错误 no host found。但是当我尝试使用 gmail 时,它可以工作。gmail : IMAP HOSTNAME '{imap.gmail.com:993/imap/ssl}INBOX' POP3 HOSTNAME: '{pop.gmail.com:993/ipop3/ssl}INBOX' Rediffmail 和 Hotmail 是否提供任何此类服务来访问邮箱.

0 投票
0 回答
1330 浏览

python - Python gmail imap - 获取电子邮件正文的文本不在单个字符串中

我一直在尝试解决这个问题,并在 stackoverflow 和其他地方找到解决方案,但我无法得到它(我猜 Python 经验不足),所以请帮忙:

我在 Python 中使用 imaplib 和电子邮件库从我的 gmail 帐户获取电子邮件。我可以登录并找到我想要的邮件,并且我已经实现了捕获多部分电子邮件的脚本,但是电子邮件正文的输出文本(通过 get_payload 方法)是一个字符串,我想获取正文发送的电子邮件,以便每个新行(作为字符串)被分隔并存储到一个列表中。请查看我的代码部分:

事先我有更多代码,顶部是运行代码所需的导入库,因此无需检查。我试图声明 text = [],我试图不剥离()文本或 html,.. 但我就是无法得到它。有没有一种简单的方法可以在发送时获取正文的文本,每个字符串都在自己的行中?我觉得它很简单,但我不明白..提前谢谢!!

0 投票
0 回答
38 浏览

php - 如何在纯文本电子邮件中将字符串标记为引用?

我如何将电子邮件的某些部分标记为要引用,即在邮件对话中出现在 gmail 等电子邮件客户端中作为“较旧的消息”?

我正在使用 PHPMailer 类发送邮件,我尝试>在每个新行之前添加,但它不起作用,在我的测试 gmail 中正常呈现。

0 投票
1 回答
205 浏览

python - 解析电子邮件后有哪些字段可用?

我正在使用email.message_from_string将电子邮件消息解析为 Python。该文档似乎没有说明有哪些标准字段。

我如何知道可以读取哪些字段,例如msg['to'],msg['from']等?如果我没有要在命令行上试验的电子邮件,我还能找到这个吗?

0 投票
1 回答
168 浏览

ruby - 存根网络::POP3.start

我为一名工作人员编写了一个测试,该工作人员会收到电子邮件,然后对他们做一些事情:

以这种方式存根的最佳方法是什么Net::POP3.start,它会在实际运行时返回类似的数据?

谢谢

迪基

编辑:

其余的工作/填写#do something看起来有点像这样:

我想出的解决方案是(这可能有点特定于您的需求):

我真的不喜欢。

使用@SteveTurczyn 正在使用的一些技术对其进行重构。

0 投票
1 回答
970 浏览

imap - PHP IMAP 解析正文文本

我使用 php imap 并且遇到了麻烦。我需要获取正文和正文 html,但看起来不一定是这样,我的代码是:

执行 var_dump 时的输出是下面的文本。但这不是电子邮件文本:

[bodyHTML] => [bodyText] =>UGVyIGNvbXBldGVuemEuIEdyYXppZQ0KDQogDQoNCkRhOiBFbWFudWVsZSBQZXJzaWNvIFttYWls dG86ZS5wZXJzaWNvQGJsdXNlcnZpY2UuaXRdIA0KSW52aWF0bzogZ2lvdmVkw6wgMTAgbHVnbGlv IDIwMTQgMTc6NDQNCkE6IENyaW5pdGkgU29uaWENCkNjOiBOYXN0YSBFbWlsaWENCk9nZ2V0dG86 IEZ3ZDogSTogUml2aXN0YSBkaSBkaXJpdHRvIHByb2Nlc3N1YWxlIC0gY29kaWNlIGNsaWVudGUg MDAwMTY1NDc3Mw0KDQogDQoNCkNpYW8gU29uaWEsDQoNCmNvbiBsYSBwcmVzZW50ZSByZXN0aXR1 aWFtbyBsYSBwcmF0aWNhIGluZXJlbnRlIGlsIGNsaWVudGUgYy8xNjU0NzczIGRpIGNvbXBldGVu emEgSXBzb2EuDQoNCkdyYXppZSBFbWFudWVsZQ0KDQoNCg0KLS0tLS0tLS0gTWVzc2FnZ2lvIG9y aWdpbmFsZSAtLS0tLS0tLSANCg0KT2dnZXR0bzogDQoNCkk6IFJpdmlzdGEgZGkgZGlyaXR0byBw cm9jZXNzdWFsZSAtIGNvZGljZSBjbGllbnRlIDAwMDE2NTQ3NzMNCg0KRGF0YTogDQoNCk1vbiwg MTYgSnVuIDIwMTQgMTE6NTQ6MDEgKzAyMDANCg0KTWl0dGVudGU6IA0KDQpDcmluaXRpIFNvbmlh IDxTb25pYS5DcmluaXRpQHdraS5pdD4gPG1haWx0bzpTb25pYS5DcmluaXRpQHdraS5pdD4gDQoNCkE6IA0KDQo8Y2xpZW50aWdpdXJpZGljYUB3a2ltYWlsLml0PiA8bWFpbHRvOmNsaWVudGlnaXVy aWRpY2FAd2tpbWFpbC5pdD4gDQoNCg0KDQoNCg0KDQogIA0KDQogIA0KDQpEYTogTGlhIENhcm9s aW5hIEJhdGlzdGEgQ2ludHJhIFttYWlsdG86bGlhLmJhdGlzdGFAZ21haWwuY29tXSANCkludmlh dG86IG1lcmNvbGVkw6wgMTEgZ2l1Z25vIDIwMTQgMTQ6MjANCkE6IFNob3BXS0k7IEluZm8gQ29t bWVyY2lhbGkgV29sdGVyc0tsdXdlciBJdGFsaWE7IFNlcnZpemlvIENsaWVudGkgVXRldCBHaXVy aWRpY2ENCk9nZ2V0dG86IFJlOiBSaXZpc3RhIGRpIGRpcml0dG8gcHJvY2Vzc3VhbGUgLSBjb2Rp Y2UgY2xpZW50ZSAwMDAxNjU0NzczIA0KDQogIA0KDQpOb24gcmllc2NvIGEgY2FwaXJlIHBlcbWVyY2lhbGkgV29sdGVyc0tsdXdlciBJdGFsaWE7IFNlcnZpemlvIENsaWVudGkgVXRldCBHaXVy aWRpY2ENCk9nZ2V0dG86IFJlOiBSaXZpc3RhIGRpIGRpcml0dG8gcHJvY2Vzc3VhbGUgLSBjb2Rp Y2UgY2xpZW50ZSAwMDAxNjU0NzczIA0KDQogIA0KDQpOb24gcmllc2NvIGEgY2FwaXJlIHBlcbWVyY2lhbGkgV29sdGVyc0tsdXdlciBJdGFsaWE7IFNlcnZpemlvIENsaWVudGkgVXRldCBHaXVy aWRpY2ENCk9nZ2V0dG86IFJlOiBSaXZpc3RhIGRpIGRpcml0dG8gcHJvY2Vzc3VhbGUgLSBjb2Rp Y2UgY2xpZW50ZSAwMDAxNjU0NzczIA0KDQogIA0KDQpOb24gcmllc2NvIGEgY2FwaXJlIHBlc

0 投票
0 回答
1275 浏览

php - php MIME 邮件解析 - imap。如何解析正文和正文 html?

一段时间以来,我一直在尝试从 gmail 获取电子邮件,对其进行解析,然后将所需的数据放入数据库中,但我发现使用 PHP MailParse 很难,因为它的文档很差。我尝试了在谷歌代码上找到的 MimeMailParser.class.php(它在内部使用 MailParse),但它没有按预期工作(或者可能是我的错)。

情况:客户通过不同的邮件地址发送电子邮件,所有这些电子邮件都被转发到一个唯一的电子邮件地址。我必须在这个中央邮箱上收到电子邮件。

目标:我想解析电子邮件正文文本和正文 HTML,脚本:使用 MimeMailParse:

$text 的输出如 $body,$html 的输出为空。

使用原始 Mailparse:

输出:

那么如何使用这些库或其他库获取 html 正文和文本正文(我希望他们有一些示例和文档)

0 投票
2 回答
1065 浏览

java - 如何从包含电子邮件的文本文件中提取正文 [安然数据集]

我将安然电子邮件数据集作为一个文件夹,其中包含文本文件形式的电子邮件,我想提取这些电子邮件的“正文”部分

问题是,发件人的电子邮件、收件人的电子邮件等字段由 To:、From: 等指定。但 Body 不以任何标题开头,它只是在指定所有其他字段后才开始。

现在,一个文本文件可以包含许多正文(在电子邮件线程/对话的情况下)。我想从这些文件中提取正文。可以使用javamail api,如果可以,那么如何使用?它只是离线数据集,在我的硬盘驱动器中以文​​本文件的形式,而不是在互联网上。

文件是这样的——

0 投票
1 回答
1096 浏览

php - PHP Mailparse 阻塞非 ASCII 字符

我正在使用 Mailparse 解析电子邮件并将其存储在 MySQL 数据库中。电子邮件直接通过管道传输到 PHP 脚本。超过 99% 的系统电子邮件都被正确解析。但是,我注意到一些电子邮件被截断了。问题似乎是邮件标题和正文之间的 unicode 字符......

上面的内容将在标题之后被裁剪,到达的只是“Det h”。不知何故,当非 ascii 字符 (ü) 位于标头或多部分包装器之外时,它们会导致 mailparse 阻塞。这可能是客户端正在使用的 5 年前瑞典版本的 Microsoft Windows Live Mail,弄乱了标题等,但这不是借口,我需要能够接收它。

我正在运行default_charset = "utf-8"php.ini 中的 PHP 5.4.30。但我注意到默认phpinfo()情况mailparse.def_charset = "us-ascii"下,即使 php.ini 中没有配置它。添加该行并将其设置为“utf8”后,phpinfo()正确显示了 utf-8。但是错误仍然存​​在。我没主意了。

有关如何处理此错误的任何建议?