我整天都在编程以实现我的目标。起初我尝试使用正则表达式 (Regex),但它接缝太复杂且效率低下,尽管它确实在一定程度上实现了我的目标。
这是我正在使用的网站的链接:
http://thewarezscene.org/forums/memberlist.php?start=20
如果您查看页面的源代码(该站点目前似乎已关闭),您会注意到这个重复出现的链接标签:
<a href="http://thewarezscene.org/forums/username-u14088.html">USERNAME</a>
每个新页面都有一个注册到该站点的每个人的列表。以 20 递增。例如。开始=20,开始=40,开始=60。我知道如何从 HTML 页面获取所有元素,但是仅获取特定链接格式的链接文本的最佳解决方案是什么?