如果我有表单的 HTML
<ol>
<li>Cheeses
<ol>
<li>Red Leicester</li>
<li>Cheddar</li>
</ol>
<li>Wines
<ol>
<li>Burgundy</li>
<li>Beaujolais</li>
</ol>
</ol>
我想把它解析成一个类似的结构
{"Cheeses":["Red Leicester", "Cheddar"], "Wines":["Burgundy", "Beaujolais"]}
有很多关于如何使用 HTML::TreeBuilder 或 Mojo::DOM 等模块来解析 HTML 的“教程”,但它们似乎总是依赖于使用“id=”或“class=”标签。我要解析的 HTML 没有任何 ID 标签或其他属性。我怎样才能做到这一点?