6

是否可以通过使用类似 的模式搜索其文本来找到网页上的链接A-ZNN:NN:NN:NN,其中N是单个数字 (0-9)。

我在 PHP 中使用 Regex 将文本转换为链接,所以我想知道是否可以在 Selenium 中使用这种过滤器和 C# 来查找看起来都一样的链接,遵循某种格式。

我试过:

driver.FindElements(By.LinkText("[A-Z][0-9]{2}):([0-9]{2}):([0-9]{2}):([0-9]{2}")).ToList();

但这没有用。有什么建议吗?

4

2 回答 2

11

总之,不,没有一个FindElement()策略支持使用正则表达式来查找元素。最简单的方法是使用FindElements()查找页面上的所有链接,并将它们的.Text属性与您的正则表达式匹配。

请注意,如果单击链接会导航到同一浏览器窗口中的新页面(即,单击链接时不会打开新的浏览器窗口),您需要捕获所有链接的确切文本'想点击以备后用。我之所以提到这一点,是因为如果您尝试保留对在初次FindElements()调用期间找到的元素的引用,那么在您单击第一个元素后它们将变得陈旧。如果这是您的场景,代码可能如下所示:

// WARNING: Untested code written from memory. 
// Not guaranteed to be exactly correct.
List<string> matchingLinks = new List<string>();

// Assume "driver" is a valid IWebDriver.
ReadOnlyCollection<IWebElement> links = driver.FindElements(By.TagName("a"));

// You could probably use LINQ to simplify this, but here is
// the foreach solution
foreach(IWebElement link in links)
{
    string text = link.Text;
    if (Regex.IsMatch("your Regex here", text))
    {
        matchingLinks.Add(text);
    }
}

foreach(string linkText in matchingLinks)
{
    IWebElement element = driver.FindElement(By.LinkText(linkText));
    element.Click();
    // do stuff on the page navigated to
    driver.Navigate().Back();
}
于 2012-09-17T00:13:22.007 回答
2

不要使用正则表达式来解析 Html。

使用htmlagilitypack

您可以按照以下步骤操作:

Step1用于HTML PARSER从特定网页中提取所有链接并将其存储到列表中。

HtmlWeb hw = new HtmlWeb();
 HtmlDocument doc = hw.Load(/* url */);
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href]"))
 {
//collect all links here
 }

Step2使用此正则表达式匹配列表中的所有链接

.*?[A-Z]\d{2}:\d{2}:\d{2}:\d{2}.*?

第 3 步您将获得所需的链接。

于 2012-09-16T15:20:30.863 回答