1

我正在做一些python程序来提取歌词

我使用的代码:

    import urllib
    from bs4 import BeautifulSoup
    url = urllib.urlopen("http://www.lyricsnmusic.com/david-bowie/slip-away-lyrics/22143075")
    soup = BeautifulSoup(url.read())
    print soup.find('pre', itemprop='description')

结果让我得到了我需要的东西,但带有额外的标签,例如:<pre item="description>那么歌词有人知道如何只获取歌词吗?结构将歌词放在 pre 标签之间提前谢谢

4

1 回答 1

0

使用您找到的节点的文本属性

import urllib
from BeautifulSoup import BeautifulSoup
url = urllib.urlopen("http://www.lyricsnmusic.com/david-bowie/slip-away-lyrics/2
2143075")
soup = BeautifulSoup(url.read())
desc=soup.find('pre', itemprop='description')
print desc.text
于 2013-09-15T13:02:17.297 回答