我正在尝试将 mailto URL 解析为一个不错的对象或字典,其中包括subject
,body
等。我似乎找不到实现这一目标的库或类 - 你知道吗?
mailto:me@mail.com?subject=mysubject&body=mybody
我正在尝试将 mailto URL 解析为一个不错的对象或字典,其中包括subject
,body
等。我似乎找不到实现这一目标的库或类 - 你知道吗?
mailto:me@mail.com?subject=mysubject&body=mybody
您可以使用 urlparse 和 parse_qs 以 mailto 作为方案来解析 url。请注意,根据方案定义:
mailto:me@mail.com,you@mail.com?subject=mysubject
等同于
mailto:?to=me@mail.com&to=you@mail.com&subject=mysubject
这是一个例子:
from urlparse import urlparse, parse_qs
from email.message import Message
url = 'mailto:me@mail.com?subject=mysubject&body=mybody&to=you@mail.com'
msg = Message()
parsed_url = urlparse(url)
header = parse_qs(parsed_url.query)
header['to'] = header.get('to', []) + parsed_url.path.split(',')
for k,v in header.iteritems():
msg[k] = ', '.join(v)
print msg.as_string()
# Will print:
# body: mybody
# to: me@mail.com, you@mail.com
# subject: mysubject
核心 urlparse 库在 mailtos 上的工作并不出色,但可以帮助您完成一半:
In [3]: from urlparse import urlparse
In [4]: urlparse("mailto:me@mail.com?subject=mysubject&body=mybody")
Out[4]: ParseResult(scheme='mailto', netloc='', path='me@mail.com?subject=mysubject&body=mybody', params='', query='', fragment='')
编辑
一点研究发现了这个线程。底线:python url 解析很糟糕。
似乎您可能只想编写自己的函数来执行此操作。
编辑:这是一个示例函数(由 python noob 编写)。
编辑2,清理做反馈:
from urllib import unquote
test_mailto = 'mailto:me@mail.com?subject=mysubject&body=mybody'
def parse_mailto(mailto):
result = dict()
colon_split = mailto.split(':',1)
quest_split = colon_split[1].split('?',1)
result['email'] = quest_split[0]
for pair in quest_split[1].split('&'):
name = unquote(pair.split('=')[0])
value = unquote(pair.split('=')[1])
result[name] = value
return result
print parse_mailto(test_mailto)
这是使用 re 模块的解决方案...
import re
d={}
def parse_mailto(a):
m=re.search('mailto:.+?@.+\\..+?', a)
email=m.group()[7:-1]
m=re.search('@.+?\\..+?\\?subject=.+?&', a)
subject=m.group()[19:-1]
m=re.search('&.+?=.+', a)
body=m.group()[6:]
d['email']=email
d['subject']=subject
d['body']=body
这假设它与您发布的格式相同。您可能需要进行修改以更好地满足您的需求。
电池包括:urlparse。
import urllib
query = 'mailto:me@mail.com?subject=mysubject&body=mybody'.partition('?')[2]
print dict((urllib.unquote(s).decode('utf-8') for s in pair.partition('=')[::2])
for pair in query.split('&'))
# -> {u'body': u'mybody', u'subject': u'mysubject'}
你应该使用这样的特殊库
https://pypi.python.org/pypi/urlinfo
并贡献和创建问题以使 Python 变得更好;)
PS 不使用 Robbert Peters 解决方案,因为它被破解并且无法正常工作。同样使用正则表达式是使用超级 BFG Gun 来获取小鸟。