我正在做一个从网页获取信息的项目。在 html 源代码中,我有以下内容:
Resultado de Busca: Foram encontrados 264 casais
我需要得到“encontrados”和“casais”之间的数字
无论如何在Python中可以做到这一点?我应该使用什么字符串函数?在这种情况下,我想避免使用正则表达式。
import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()
print(s.split())
到目前为止我得到了这个,但现在我很难找到我需要的号码。
import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()
num = int(s[s.index("encontrados")+len("encontrados"):s.index("casais")])
这给了我下面的错误
TypeError:类型 str 不支持缓冲区 API