我正在做一个下载管理器。我想让下载管理器在下载文件后检查 url 的 md5 哈希。哈希值在页面上找到。它需要计算文件的 md5(已完成),在 html 页面上搜索匹配项,然后比较 html 页面的全部内容以找到匹配项。
我的问题是如何让 python 返回 html 的全部内容并找到我的“md5 字符串”的匹配项?
Requests lib 是您想要使用的。将为您省去很多麻烦
import urllib
并urllib.urlopen
用于获取 html 的内容。import re
使用正则表达式搜索哈希码。您也可以find
在字符串上使用方法而不是正则表达式。
如果您遇到问题,那么您可以提出更具体的问题。你的问题太笼统了。