我有来自游戏列表的维基百科页面的以下源代码。我需要从源中获取游戏的名称,它位于 title 属性中,如下所示:
<td><i><a href="/wiki/007:_Quantum_of_Solace" title="007: Quantum of Solace">007: Quantum of Solace</a></i><sup id="cite_ref-4" class="reference"><a href="#cite_note-4"><span>[</span>4<span>]</span></a></sup></td>
正如您在上面看到的,在 title 属性中有一个字符串。我需要使用 GREP 在每一行中搜索发生这种情况的时间,并删除除以下内容之外的所有内容:
title="Game name"
我有以下(在 TextWrangler 中)返回每一次出现:
title="(.*)"
我现在如何设置它以删除周围的所有内容,但要确保它单独保留字符串或 title="string"。