我正在寻找一个漂亮的汤命令组合,以正确的顺序从 a-tag 字符串中提取“字符串”。
来源 1:
<a href="target" title="title">a-string <img alt="img-alt"> <span>span-string</span></a>
目标 1:“a-string img-alt span-string”
来源 2:
<a href="target" title="title"><span>span</span> string <img alt="alt"></a>
目标 2:“span-string a-string img-alt”
很容易通过“find_all()”获取子元素,通过“get_text()”获取文本。
如何获得不同“字符串”的正确顺序?还是按顺序解析a-string中的所有信息?