Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想使用 AWK 从这样的 html 中获取名称:
span class="full-name" span class="given-name" John /span span class="family-name" Doe /span /span
所以我想从中提取John和提取Doe,通过切割... "given-name"直到之后的部分/span以及姓氏。
John
Doe
... "given-name"
/span
你能帮我解决这个问题吗?
我不确定您关于<和>符号的问题发生了什么。据我了解,您的 html 如下所示:
<
>
<span class="full-name"><span class="given-name">John</span><span class="family-name">Doe</span></span>
您可以GNU grep像这样使用来获取所需的标签:
GNU grep
grep -oP '(?<=-name">)[^<]*' file
结果:
John Doe