我下载了一些 youtube 评论页面,我想从以下代码块中提取用户名(或用户显示名)和链接:
<p class="metadata">
<span class="author ">
<a href="/channel/UCuoJ_C5xNTrdnc4motXPHIA" class="yt-uix-sessionlink yt-user-name " data-sessionlink="ei=CKG174zFqbQCFZmaIQodtmyE0A%3D%3D" dir="ltr">Sabil Muhammad</a>
</span>
<span class="time" dir="ltr">
<a dir="ltr" href="http://www.youtube.com/comment?lc=S2ZH2gSPYaef43vTRkLDxUzo2fYicVUc3SFvmYq2jrs">
il y a 1 jour
</a>
</span>
</p>
我想提取 /channel/UCuoJ_C5xNTrdnc4motXPHIA 和 Sabil Muhammad
html页面中当然有很多很多行,但我只想像上面那样专注于代码块并提取所有用户名和相应的链接,并将它们放入日志文件中
有什么好的脚本吗?我知道 bash 和 c/c++
谢谢!