问题标签 [email-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
1950 浏览

node.js - imap + 电子邮件解析器,除最后一个外,所有标题字段均未定义

我正在构建一个简单的 nodejs 脚本,它将获取我的 gmail 电子邮件并将其数据存储在 CouchBase 中。

问题是除了最后一个之外的所有标题字段都显示为未定义。

代码:

'doc.subject' 的控制台日志输出:

其中一条消息如下所示:

因此标题错误地解释为文本?

0 投票
2 回答
1264 浏览

php - 使用 PHP 解析以 base64 utf8 编码的多部分电子邮件

我有一条要解码的多部分消息(见下文)。

我可以使用 PHP 的base64_decode函数来解码普通电子邮件,但它不适用于多部分电子邮件。

有谁知道如何做到这一点或知道任何可用的脚本?

0 投票
3 回答
162 浏览

ruby - 如何在 ruby​​ 中编写这个正则表达式?(解析 Gmail API 字段)

我需要解析 3 种类型的字符串:

我需要每个的哈希,看起来像:

0 投票
1 回答
311 浏览

c# - OpenPoup.NET - 从转发的消息中查找电子邮件、主题和日期 - C#

我正在使用 OpenPoup.NET 来阅读来自 Gmail 的电子邮件。我想识别转发消息的原始发件人、收件人、日期和主题。我的电子邮件看起来像,

----------------------电子邮件正文开始---------------------- ----------

仅供参考,请阅读以下电子邮件以了解按钮。

奇拉格开发商 XYZ 有限公司

发件人:Rat Chanra [mailto:rat@chanra.com] 发送时间:2015 年 6 月 5 日,星期五 9:48 PM 收件人:Chirag 主题:FW:复制产品按钮

嗨,老鼠,

我已经包含了复制产品按钮的 .png。如果我们想更新所有按钮,还附上更新按钮的 .eps!

来聊聊吧

阿里设计师

----------------------电子邮件正文结束-------------- ----------

我想找到原始消息的 From、Date、Sublect 和 To,在这种情况下,

我可以使用 OpenPopUp.net 做到这一点吗?

我是否必须使用 RegEx 解析电子邮件正文并获取上述详细信息。如果是,那么最好的方法是什么?我正在使用 C#

0 投票
1 回答
1110 浏览

regex - 使用正则表达式解析 EML 文本

你能帮我用正则表达式解析 EML 文本吗?

我想单独获得:

1)。Content-Transfer-Encoding: base64 和 --=_alternative 之间的文本,如果上面有 Content-Type: text/html

2)。Content-Transfer-Encoding: base64 和 --=_related 之间的文本,如果上面有两行 Content-Type: image/jpeg

请看一下powershell中的代码和平:

谢谢你的帮助。祝你今天过得愉快。

PS 基于 Jessie Westlake 的代码,这里是 RegEx 的一个小编辑版本,对我有用:

0 投票
0 回答
60 浏览

php - Zend Message - 从文件而不是从存储中读取

使用\Zend\Mail\Storage\Imap我可以阅读电子邮件使用$storage->getMessage($i);

问题是 - 是否可以(使用Zend\Mail)从字符串或文件中读取消息?我想编写测试来测试电子邮件是否被正确解析,但目前我不知道在\Zend\Mail\Storage\Message没有实际从存储中获取电子邮件但从字符串或文件中读取它的情况下我可以创建的方式。

0 投票
1 回答
4138 浏览

node.js - 使用 node-imap 和 mailparser 的 gmail 解析不正确

我正在编写一个 Node.js 脚本,该脚本使用 node-imap 从我的 gmail 收件箱中检索未读电子邮件,使用 mailparser 对其进行解析,然后对已解析的电子邮件进行一些处理。我遇到了一个问题,mailparser 似乎没有正确解析收到的原始电子邮件。我不确定我在调用 node-imap 或 mailparser 时是否做错了什么,或者电子邮件本身是否出于某种原因格式错误。我已经包含了我正在运行的代码以及产生的输出。

输出:

0 投票
0 回答
112 浏览

node.js - 超过 1.8G 限制的 Node.js 潜在内存泄漏

我有一个 Node.js 应用程序,它每 15 分钟检查和检索一次电子邮件。我正在使用node-imapmailparser。当我测试时,我发现内存似乎泄漏了。运行一夜后,我的进程内存从 50MB 增加到 2.3GB。

这里有一些问题问我。1,我知道Node.js有内存限制(实际上是v8限制),在x64系统中大约是1.8G。但我的应用程序使用了 2.3G。为什么会这样?这是否意味着 v8 的内存被泄露了?2,我附加memwatch了模块并试图找出原因。但是在运行我的应用程序 30 分钟后,我可以看到内存从 50MB 增加到 200MB,但memwatch没有触发leak事件。这是否意味着没有内存泄漏?还是因为非 v8 内存泄漏但memwatch无法检测到?

我是 Node.js 性能调整和内存分析的新手,因此任何想法都会受到赞赏。

谢谢,

每次heapdump应用程序检索电子邮件后, 我都会转储快照。然后我得到了 4 个快照,当我比较它们时,“字符串”是增加最多的类别(来自相同的结果memwatch.diff。在 Chrome 开发工具中,它们都被标记为“(切片字符串)中的父级”。所以我想知道是什么这意味着。为什么它不能被 GCed,因为它只是我函数中的一个本地变体,每次我需要检查邮件时都会调用它。

0 投票
0 回答
269 浏览

ruby - 使用 Ruby/Rails 仅解析传入电子邮件的 HTML 部分(不是文本部分)

我正在编写一个 Ruby/Rails 脚本,我想解析转发到特定电子邮件地址的传入电子邮件。我想首先解析电子邮件的 HTML 正文。我已经弄清楚如何获取邮件对象的主题和正文属性并将正文属性转换为字符串,但是它包含一些标题文本和一些奇怪的电子邮件代码/行话(见下文)。我只想解析电子邮件的主要 HTML 正文部分(不是纯文本部分)。有没有办法只解析电子邮件的 HTML 部分?另外,有没有办法排除标题文本和代码行话?我正在从控制器操作调用我的电子邮件处理程序方法,我的电子邮件处理程序的代码和电子邮件正文输出如下:

电子邮件处理程序代码

将其转换为字符串后的电子邮件正文:

0 投票
1 回答
293 浏览

javascript - 使用 MailParser Node js 时首先发生哪个事件

我正在使用MailParser解析节点 js 中的电子邮件。在 mailparser 中的以下事件中,哪个先工作或并行工作