0

我正在使用 watin dll 浏览网页,单击li标签中的链接,转到下一页,获取一些数据,返回上一页并单击下一个li标签中的链接。

我可以通过li标签中的一个链接来做到这一点。我想在点击每个链接li下获取所有标签ul <classname>并执行上述过程。我怎样才能得到所有的li和循环通过每一页?

页面的HTML代码是这样的:

<ul id="ul_classname" class="search-result-set">
    <li class="">
        <div class="Div_Classname">
            <h3 class="standard_font">
                <a class="a class_name" href="link to be clicked">text to be displayed</a>
            </h3>
            <p class="word-wrap"></p>
        </div>
    </li>
    <li class="">
        <div class="Div_Classname">
            <h3 class="standard_font">
                <a class="a class_name" href="link to be clicked">text to be displayed</a>
            </h3>
            <p class="word-wrap"></p>
        </div>
    </li>
</ul>
4

3 回答 3

1

您可以尝试使用此代码(Linq to XML)

var xdoc = XDocument.Load(yourFile);

var terms= from term in xdoc.Descendants("ul")
        select new
        {
              Class= term.Attribute("class").Value
        };

foreach(var li in terms)
{
   Console.Write(li.Class);
}
于 2012-07-04T06:57:58.640 回答
1

试试这个:

LinkCollection links = ie.Links;
foreach (var link in links)
{
    link.Click();
    // Do something
    ie.Back();
}
于 2012-07-04T07:32:58.173 回答
1

private void CrawlSite()
{
    int idx = 0;
    do
    {
        idx = this.ClickLink(idx);
    }
    while (idx != -1);
}

private int ClickLink(int idx)
{
    WatiN.Core.Browser browser = GetBrowser();

    ListItemCollection listItems = browser.List("ul_classname").ListItems;
    if (idx > listItems.Count - 1)
        return -1;

    Link lnk = listItems[idx].Link(Find.ByClass("a class_name"));
    lnk.Click();

    //TODO: get your data

    browser.Back();

    return idx + 1;
}
于 2012-07-04T08:57:14.690 回答