我正在尝试从网站(html)获取信息到 MATLAB。我可以使用以下方法将在线的 html 转换为字符串:
urlread('http://www.websiteNameHere.com...');
一旦我有了字符串,我就有了一个非常长的字符串变量,其中包含整个 html 文件的内容。从这个变量中,我正在寻找非常具体的类中的值/字符。例如,html/website 将有一堆行,然后将有以下形式的感兴趣的类:
...
<h4 class="price">
<span class="priceSort">$39,991</span>
</h4>
<div class="mileage">
<span class="milesSort">19,570 mi.</span>
</div>
...
<h4 class="price">
<span class="priceSort">$49,999</span>
</h4>
<div class="mileage">
<span class="milesSort">9,000 mi.</span>
</div>
...
我需要能够获取和之间的<span class="priceSort">
信息</span>
;即上述示例中的 39,991 美元和 49,999 美元。解决此问题的最佳方法是什么?如果标签是特定的开头和结尾也相同(例如<price>
and </price>
),我不会有问题...
我还需要知道最可靠的方法,因为我也希望能够找到<span class="milesSort">
此类信息和其他信息。谢谢!