我想从网站列表中提取域和路径。例如,如果网站是http://www.domain.com/path1/page1.html我想获取http://www.domain.com/path1/,如果网站是http://www。 domain2.com/path2/page2/我想获得http://www.domain2.com/path2/。
我尝试下载页面并检索所有锚点,但我只能获取文件的相对路径(在本例中为 /page1.html 和 /page2/)。有没有办法让我实现我想要的?
我想从网站列表中提取域和路径。例如,如果网站是http://www.domain.com/path1/page1.html我想获取http://www.domain.com/path1/,如果网站是http://www。 domain2.com/path2/page2/我想获得http://www.domain2.com/path2/。
我尝试下载页面并检索所有锚点,但我只能获取文件的相对路径(在本例中为 /page1.html 和 /page2/)。有没有办法让我实现我想要的?
path2 并非总是存在于所有 url 中。所以你不会得到一个现成的方法来解析它。我建议非常粗略地为此编写一个函数,以给您一个想法:
var index = url.IndexOf(".com/");
var substringAfterFirstSlash = url.SubString(index, url.Length + 1 - index)
var indexOfSecondSlash = substringAfterFirstSlash.IndexOf("/") + index;
var yourPath = url.SubString(0, indexOfSecondSlash+1 );