我想使用jsoup从 url List of city and towns in India中提取所有城市名称和州名,下面给出了该页面的 HTML 代码片段。
这里Abhaypuri是一个城市的名称,而Assam是一个州的名称。类似的城市和州名也在页面中多次出现在这种出现数千次的表结构中,除了td 标记内 的url之外,其他一切都相同。
<table class="wikitable sortable" style="text-align:;">
<tr>
<th>Name of City/Town</th>
<th>Name of State</th>
<th>Classification<pre><code></th>
<th>Population (2001)<pre><code></th>
<th>Population (2011)<pre><code></th>
</tr>
<tr>
<td><pre><code><a href="/wiki/Abhayapuri" title="Abhayapuri">Abhayapuri<pre><code></a><pre><code></td>
<td><pre><code><a href="/wiki/Assam" title="Assam">Assam<pre><code></a><pre><code></td>
我是jsoup的新手。任何帮助,将不胜感激。谢谢你。