我正在从头开始制作一个搜索引擎(大声笑),我坚持这个问题:
当用户提交 URL 时,我的“蜘蛛”会“抓取”它以获取其他链接。有些人当然使用<a href="/page">
而不是<a href="http://long-domain.com/page">
,所以我用
if(substr($link->getAttribute('href'), 0, 1) == '/')
并在其前面添加一个域。但是,每当我添加一个域时,一些链接就会变成http://php.net//abcd
. 如您所见,它的//
.
现在,我的想法是让我的脚本编辑提交的 URL,所以如果它最后有一个斜杠,它将被删除,但我不知道如何删除它。