1

我想使用 AWK 从这样的 html 中获取名称:

span class="full-name" span class="given-name" John /span span class="family-name" Doe /span  /span 

所以我想从中提取John和提取Doe,通过切割... "given-name"直到之后的部分/span以及姓氏。

你能帮我解决这个问题吗?

4

1 回答 1

3

我不确定您关于<>符号的问题发生了什么。据我了解,您的 html 如下所示:

<span class="full-name"><span class="given-name">John</span><span class="family-name">Doe</span></span>

您可以GNU grep像这样使用来获取所需的标签:

grep -oP '(?<=-name">)[^<]*' file

结果:

John
Doe
于 2012-12-05T00:50:27.687 回答