0

我需要将 secondsync.com/leaderboard.html#Wed-May-22-2013/totals 此处的排行榜结果转换为提要。

他们使用 js 来提取此信息。如何识别 JS 并从另一个页面提取数据?

谢谢。

4

1 回答 1

1

也许您可以使用本教程
http://www.1stwebdesigner.com/tutorials/php-crawler-tutorial/ (需要一些 PHP 和 REGEX 技能)
来抓取页面内容,然后使用 REGEX 访问您需要的内容。

使用正则表达式,您可以 match() 第一个:

<td class="tweets">*<td>

你应该得到类似的东西

<td class="tweets">91,621<td>

然后将每个 <*> 替换为 ''

剩下的数字是 91,621。

这可以修改为 <'td class="peak">* ,如果您对峰值或类似的东西感兴趣,只需查看他们(secondsync)如何在其源代码中描述它。

抱歉没有提供更好的帮助,我现在想不出更好的解决方案。

于 2013-05-23T17:15:40.197 回答