此应用程序将下载一个网页并在页面文本中查找所有电子邮件地址并返回它们的列表。
这是我当前的代码:
def emails(content):
'return list of email addresses contained in string content'
email = []
content = urlopen(url).read().decode()
pattern='[A-Za-z0-9_.]+\@[A-Za-z0-9_.]+\....'
email.append(re.findall(pattern,content))
print(email)
但由于某种原因,我得到:
[['somePERSON@university.ca"']]
代替 :
['somePERSON@university.ca']