-2

我想从网站列表中提取域和路径。例如,如果网站是http://www.domain.com/path1/page1.html我想获取http://www.domain.com/path1/,如果网站是http://www。 domain2.com/path2/page2/我想获得http://www.domain2.com/path2/

我尝试下载页面并检索所有锚点,但我只能获取文件的相对路径(在本例中为 /page1.html 和 /page2/)。有没有办法让我实现我想要的?

4

1 回答 1

0

path2 并非总是存在于所有 url 中。所以你不会得到一个现成的方法来解析它。我建议非常粗略地为此编写一个函数,以给您一个想法:

var index = url.IndexOf(".com/");
var substringAfterFirstSlash = url.SubString(index, url.Length + 1 - index)
var indexOfSecondSlash = substringAfterFirstSlash.IndexOf("/") + index;
var yourPath = url.SubString(0, indexOfSecondSlash+1 );
于 2012-07-16T20:28:22.883 回答