我已经使用 Python 获得了网页的 HTML,现在我想找到在标题中链接到的所有 .CSS 文件。我尝试了分区,如下所示,但是在运行它时出现错误“IndexError:字符串索引超出范围”并将每个都保存为自己的变量(我知道如何做这部分)。
sytle = src.partition(".css")
style = style[0].partition('<link href=')
print style[2]
c =1
我不认为这是处理这个问题的正确方法,所以希望得到一些建议。提前谢谢了。这是我需要从中提取 .CSS 文件的文本的一部分。
<meta name="viewport" content="width=device-width, initial-scale=1.0, minimum-scale=1.0" />
<!--[if gte IE 7]><!-->
<link href="/stylesheets/master.css?1342791430" media="screen, projection" rel="stylesheet" type="text/css" />
<link href="/stylesheets/adapt.css?1342791413" media="screen, projection" rel="stylesheet" type="text/css" />
<!-- <![endif]-->
<link href="/stylesheets/print.css?1342791421" media="print" rel="stylesheet" type="text/css" />
<link href="/apple-touch-icon-precomposed.png" rel="apple-touch-icon-precomposed" />
<link href="http://dribbble.com/shots/popular.rss" rel="alternate" title="RSS" type="application/rss+xml" />