我正在尝试使用以下语句从网页中获取标题:
titl1 = re.findall(r'<title>(.*?)</title>',the_webpage)
使用它,我得到['random webpage example1']
. 如何删除引号和括号?
我还尝试使用以下方法获取一组每小时更改一次的链接(这就是我需要通配符的原因)links = re.findall(r'(file=(.*?).mp3)',the_webpage)
:
我明白了
[('file=http://media.kickstatic.com/kickapps/images/3380/audios/944521.mp3',
'http://media.kickstatic.com/kickapps/images/3380/audios/944521'),
('file=http://media.kickstatic.com/kickapps/images/3380/audios/944521.mp3',
'http://media.kickstatic.com/kickapps/images/3380/audios/944521'),
('file=http://media.kickstatic.com/kickapps/images/3380/audios/944521.mp3',
'http://media.kickstatic.com/kickapps/images/3380/audios/944521')]
如何在没有 的情况下获得 mp3 链接file=
?
我还想下载 mp3 文件并在它们后面附加网站的标题,这样它就会显示
random webpage example1.mp3
我该怎么做?我还在学习 Python 和正则表达式,这有点难倒我。