我下载了一些 youtube 评论页面,我想从以下代码块中提取用户名(或用户显示名)和链接:
 <p class="metadata">
      <span class="author ">
        <a href="/channel/UCuoJ_C5xNTrdnc4motXPHIA" class="yt-uix-sessionlink yt-user-name " data-sessionlink="ei=CKG174zFqbQCFZmaIQodtmyE0A%3D%3D" dir="ltr">Sabil Muhammad</a>
      </span>
        <span class="time" dir="ltr">
          <a dir="ltr" href="http://www.youtube.com/comment?lc=S2ZH2gSPYaef43vTRkLDxUzo2fYicVUc3SFvmYq2jrs">
            il y a 1 jour
          </a>
        </span>
    </p>
我想提取 /channel/UCuoJ_C5xNTrdnc4motXPHIA 和 Sabil Muhammad
html页面中当然有很多很多行,但我只想像上面那样专注于代码块并提取所有用户名和相应的链接,并将它们放入日志文件中
有什么好的脚本吗?我知道 bash 和 c/c++
谢谢!