0

我正在使用“Link Klipper”chrome 扩展程序,使用正则表达式从我的 html 实时 cbox 聊天中获取链接,此扩展程序可以保存 CSV 文件,但有时,它没有按预期工作。

<div class="Center" style="text-align: left">
 <br>
   <a class="MyURL" href="http://www.mywebsite.com/mylink" target="_blank">
    <font size=3 color="#333333" style="text-shadow: 0 0 0.1em black, 0 0 0.1em black,  0 0 0.1em black,  0 0 0.1em black,  0 0 0.1em black, 0 0 0.1em black, 0 0 0.1em black;">
      <b> My Link Name </b> 
    </font>
    <font size=3 color="#333333" style="text-shadow: 0 0 0.1em balck, 0 0 0.1em balck,  0 0 0.1em balck,  0 0 0.1em balck,  0 0 0.1em balck, 0 0 0.1em balck, 0 0 0.1em balck;">
      <b> Link Description </b>
    </font>
    <font size=3 color="#333333" style="text-shadow: 0 0 0.1em black, 0 0 0.1em black,  0 0 0.1em black,  0 0 0.1em black,  0 0 0.1em black, 0 0 0.1em black, 0 0 0.1em black;">
      <b> 100.0 MB </b>
    </font>
   </a>
 <br>
 </div>

是否有另一种有效的方法,可能使用wgetxidel以正确格式的 CSV 获取链接 + 名称 + 描述 + 大小?或任何受支持的人类可读格式。

4

2 回答 2

2

像这样的东西?

xidel -q example1.xml -e "//b"

或作为 CSV:

xidel -q example1.xml -e "join(//b,',')"
于 2016-04-27T14:32:15.870 回答
0

我使用 xidel 抓取了我的链接,并使用以下命令将链接输出到 html 文件:

xidel "http://www.mywebsite.com" --html -e //BODY/DIV/B/A > c:\Users\User\Desktop\1.html
于 2016-04-27T16:12:07.830 回答