我正在使用 Mailparse 解析电子邮件并将其存储在 MySQL 数据库中。电子邮件直接通过管道传输到 PHP 脚本。超过 99% 的系统电子邮件都被正确解析。但是,我注意到一些电子邮件被截断了。问题似乎是邮件标题和正文之间的 unicode 字符......
Delivered-To: nkafq123@gmail.com
Received: by 10.152.1.193 with SMTP id 1csp311490lao;
Mon, 20 Oct 2014 05:33:31 -0700 (PDT)
Return-Path: <lunalono@telia.com>
Received: from vps4596.inmotionhosting.com (vps4596.inmotionhosting.com. [74.124.217.238])
by mx.google.com with ESMTPS id fb7si7786786pab.30.2014.10.20.05.33.30
for <nkafq123@gmail.com>
(version=TLSv1 cipher=RC4-SHA bits=128/128);
Mon, 20 Oct 2014 05:33:30 -0700 (PDT)
Message-ID: <14FBD481E1074C79A706F0C071746F3D@acerDator>
From: =?utf-8?Q?Annelen_geretschl=C3=A4ger?= <lunalono@telia.com>
To: "neokio" <nkafq123@gmail.com>
References: <CAEMnOreG=99=qx-ONib=g+3mCQnUHC2kgdu2uBdSav5WP303BA@mail.gmail.com>
In-Reply-To: <CAEMnOreG=99=qx-ONib=g+3mCQnUHC2kgdu2uBdSav5WP303BA@mail.gmail.com>
Subject: This message will be broken
Date: Mon, 20 Oct 2014 14:33:24 +0200
MIME-Version: 1.0
Content-Type: multipart/alternative;
boundary="----=_NextPart_000_0018_01CFEC72.CE424470"
X-Priority: 3
X-MSMail-Priority: Normal
Importance: Normal
X-Mailer: Microsoft Windows Live Mail 14.0.8117.416
X-MimeOLE: Produced By Microsoft MimeOLE V14.0.8117.416
X-Source:
X-Source-Args:
X-Source-Dir:
Det här är ett flerdelat meddelande i MIME-format.
------=_NextPart_000_0018_01CFEC72.CE424470
Content-Type: text/plain;
charset="utf-8"
Content-Transfer-Encoding: quoted-printable
This is a test ... the above "Det här är" chunk will be cut off at "Det h", and nothing else will arrive.
------=_NextPart_000_0018_01CFEC72.CE424470
上面的内容将在标题之后被裁剪,到达的只是“Det h”。不知何故,当非 ascii 字符 (ü) 位于标头或多部分包装器之外时,它们会导致 mailparse 阻塞。这可能是客户端正在使用的 5 年前瑞典版本的 Microsoft Windows Live Mail,弄乱了标题等,但这不是借口,我需要能够接收它。
我正在运行default_charset = "utf-8"
php.ini 中的 PHP 5.4.30。但我注意到默认phpinfo()
情况mailparse.def_charset = "us-ascii"
下,即使 php.ini 中没有配置它。添加该行并将其设置为“utf8”后,phpinfo()
正确显示了 utf-8。但是错误仍然存在。我没主意了。
有关如何处理此错误的任何建议?