我开始用 Python 编程,并且一直在阅读一些帖子,他们说我应该使用 HTML 解析器从文本而不是重新获取 URL。
我有从 and 获得的page.read()
源urllib
代码urlopen
。
现在,我的问题是解析器正在从文本中删除 url 部分。
另外,如果我没看错,var = page.read()
,var
是否存储为字符串?
我怎么能告诉它给我两个“标签”之间的文字?URL 总是介于两者之间flv=
,;
因此它不href
以解析器查找的内容开头,也不包含http://
任何内容。
我读过很多帖子,但似乎他们都在代码中寻找`href。
我完全错了吗?
谢谢!