3

如何发送带有附件的电子邮件,其中文件名包含 unicode 字符?

到目前为止,文件将到达,但文件名为 "noname"

这是对 ASCII 文件名非常有效的部分:

import smtplib
from email.mime.text import MIMEText
from email.MIMEBase import MIMEBase
from email.MIMEMultipart import MIMEMultipart
from email.mime.application import MIMEApplication
from email.Utils import formatdate
from email import Encoders
from email.Utils import encode_rfc2231

msg = MIMEMultipart()
msg['Subject'] = "New magazine delivery!"
msg['From'] = sender_email
msg['To'] = ', '.join(kindle_emails)
msg['Date'] = formatdate(localtime=True)
message = "see attachment"
msg.attach(MIMEText(message))
part = MIMEApplication(open(f, 'rb').read(), _subtype='application/x-mobipocket-ebook')

part.add_header('Content-Disposition', 'attachment', filename=os.path.basename(filename)
msg.attach(part)

第一次尝试

添加编码、语言和编码字符串的元组,而不仅仅是文件名。

part.add_header('Content-Disposition', 'attachment', filename=('utf-8', 'fr', os.path.basename(f).encode('utf-8')))

第二次尝试:

像这样全局设置字符集:

from email import Charset
Charset.add_charset('utf-8', Charset.QP, Charset.QP, 'utf-8')

第三次尝试

使用utils.encode_rfc2231

from email.Utils import encode_rfc2231
utf8filename = encode_rfc2231(os.path.basename(f).encode('utf-8'), charset='utf-8')
part.add_header('Content-Disposition', 'attachment', filename=('utf-8', 'fr', utf8filename))

第四次尝试

用于对文件名进行urlencode urllib.quote()。这对文件名的影响与第三种方法相同。

utf8filename = urllib.quote(os.path.basename(f).encode('utf-8'))
part.add_header('Content-Disposition', 'attachment', filename=('utf-8', 'fr', utf8filename))

有任何想法吗?

我是否遗漏了有关 RFC2231 文件名字符编码的一些重要内容?

我使用 Gmail 的 SMTP 服务器和 python 2.7。

4

2 回答 2

4

而不是像这样告诉服务器它是UTF-8:

filename=('utf-8', 'fr', os.path.basename(f).encode('utf-8'))

...当我只是发送 UTF-8 而不告诉我时它可以工作:

filename=os.path.basename(f).encode('utf-8')

文件名将正确显示。

这似乎与说明的文档相矛盾:

如果值包含非 ASCII 字符,则必须指定为格式为 (CHARSET, LANGUAGE, VALUE) 的三元组,其中 CHARSET 是一个字符串,用于命名用于对值进行编码的字符集,LANGUAGE 通常可以设置为None 或空字符串(有关其他可能性,请参阅 RFC 2231),VALUE 是包含非 ASCII 代码点的字符串值。

这不起作用,但是python 3 文档添加:.

如果未传递三元组且值包含非 ASCII 字符,则会使用 utf-8 的 CHARSET 和 None 的 LANGUAGE 自动以 RFC 2231 格式对其进行编码。

只有这个有效,即使对于 python 2.7,虽然它没有在文档中提到。

于 2016-01-08T11:08:56.023 回答
0

正如Suzana指出的那样,从python 3 文档中,您不需要编码 utf-8 文件名,只需让库为您完成:

part.add_header('Content-Disposition', 'attachment', filename=('utf-8', '', filename))

这适用于 python 3.8

于 2021-09-06T16:23:42.363 回答