我的 Android 应用程序将从电话号码获取运营商信息。我打算使用 Jsoup(或其他 Java HTML 解析器)来抓取表格中显示的运营商信息。
我正在尝试从fonefinder.net中抓取
查询 URL 格式为:
http://www.fonefinder.net/findome.php?npa=**first 3 digits**&nxx=**next 3 digits**&thoublock=**final 4 digits**
页面的 HTML 是一个简单的表格(见下文)。我正在尝试从第 2 行第 5 列中提取数据,其中链接出现在格式中
http://fonefinder.net/(CARRIER_NAME).php
其中 CARRIER_NAME 是类似“verizon”的值。我需要帮助弄清楚如何提取这些数据。
<table border="3" cellspacing="2" cellpadding="2" bgcolor="#FFFFCC">
<tbody>
<tr bgcolor="#7093DB" align="CENTER">
<th>
Area Code
</th>
<th>Prefix</th>
<th>
City/Switch Name
<br>
(Click for city search)
</th>
<th>
State/Prov.
<br>
Area Map
</th>
<th>
Telephone Company
<br/>
Web link
</th>
<th>
Telco
<br/>
Type
</th>
<th>
Map/Zip
<br/>
Detail
</th>
</tr>
<tr>
<td>
**first 3 digits**
</td>
<td>
**next 3 digits**
</td>
<td>
City Name
</td>
<td>
State Name
</td>
<td>
<a href="http://fonefinder.net/CARRIER_NAME.PHP">carrier name</a>
</td>
<td>WIRELESS PROV</td>
<td>
map
</td>
</tr>
</tbody>
</table>