python - 使用关键字 python 匹配 html 文件的内容

Question

我正在做一个下载管理器。我想让下载管理器在下载文件后检查 url 的 md5 哈希。哈希值在页面上找到。它需要计算文件的 md5（已完成），在 html 页面上搜索匹配项，然后比较 html 页面的全部内容以找到匹配项。

我的问题是如何让 python 返回 html 的全部内容并找到我的“md5 字符串”的匹配项？

score 3 · Accepted Answer

3

Requests lib 是您想要使用的。将为您省去很多麻烦

于 2013-02-11T16:13:33.177 回答

score 1 · Accepted Answer

import urllib并urllib.urlopen用于获取 html 的内容。import re使用正则表达式搜索哈希码。您也可以find在字符串上使用方法而不是正则表达式。

如果您遇到问题，那么您可以提出更具体的问题。你的问题太笼统了。

2 回答 2