2

我正在使用 Selenium Webdriver (ver 2.31.2.0)(.Net),并且正在尝试提取从“driver.PageSource”返回的元素 (XML)。

我的问题:如何使用以下 xpath 获取项目列表。我可以使用 XPATH 插件在 FF 中播放,但相同的代码在 Selenium Webdriver 中不起作用

有什么帮助吗?

这是我在 Selenium Webdriver 中的代码:

var driver = new FirefoxDriver();
driver.Navigate().GoToUrl("http://website_name/languages.xml");
string _page_source = driver.PageSource;
ReadOnlyCollection<IWebElement> webElements = _page_source.FindElementsByXPath("//response//results//items/vList");

我的 xml 看起来像这样:

<response xmlns="http://schemas.datacontract.org/2004/07/myproj.cnn.com">
xmlns:i="http://www.w3.org/2001/XMLSchema-instance">
    <meta>

    </meta>
    <results i:type="vList">
        <name>Language</name>
        <queryValue>language</queryValue>
        <displayOrder>0</displayOrder>
        <items>
            <vList>
                <name>English</name>
                <displayName>English</displayName>
                <displayOrder>0</displayOrder>
                <items />
            </vList>
            <vList>
                <name>Swedish</name>
                <displayName>Swedish</displayName>
                <displayOrder>1</displayOrder>
                <items />
            </vList>
        </items>
    </results>
</response>
4

2 回答 2

4

您可以使用 selenium 浏览并获取 xml,但使用 .net 类处理 xml。

driver.PageSource属性是一个字符串,您应该直接使用 .Net 类来解析表示的 xml。此外,字符串对象没有方法FindElementsByXPath(),除非这是您编写的扩展方法。

driver.PageSource使用from selenium读取 xml

var driver = new FirefoxDriver();
driver.Navigate().GoToUrl("http://website_name/languages.xml");
XmlReader reader = XmlReader.Create(driver.PageSource);

或者,通过使用直接浏览到 url 来读取 xml

XmlReader reader = XmlReader.Create("http://website_name/languages.xml");

然后使用下面的代码来解析和读取 xml。需要注意的关键点是命名空间信息是如何提供给 xpath 的。

//load xml document
XElement xmlDocumentRoot = XElement.Load(reader);
//also add the namespace infn, chose a prefix for the default namespace
XmlNameTable nameTable = reader.NameTable;
XmlNamespaceManager namespaceManager = new XmlNamespaceManager(nameTable);
namespaceManager.AddNamespace("a", "http://schemas.datacontract.org/2004/07/myproj.cnn.com");

//now query with your xml - remeber to prefix the default namespace
var items = xmlDocumentRoot.XPathSelectElements("//a:results/a:items/a:vList", namespaceManager);

Console.WriteLine("vlist has {0} items.", items.Count());

foreach (var item in items)
{
Console.WriteLine("Display name: {0}", item.XPathSelectElement("a:displayName",namespaceManager).Value);
}
// OR get a list of all display names using linq
var displayNames = items.Select(x => x.XPathSelectElement("a:displayName", namespaceManager).Value).ToList();

您将需要以下命名空间才能使上述内容起作用:

using System;
using System.Linq;
using System.Xml;
using System.Xml.Linq;
using System.Xml.XPath;
于 2013-10-02T04:48:03.123 回答
1

您发布的 XML 输入声明了一个命名空间:xmlns="http://schemas.datacontract.org/2004/07/myproj.cnn.com". 请参阅下一行:

<response xmlns="http://schemas.datacontract.org/2004/07/myproj.cnn.com">

因为这个命名空间没有前缀,所以它是所有没有前缀的元素的默认命名空间。这意味着元素<response>和元素<results>等都属于这个命名空间。

接下来阅读:http ://www.w3schools.com/xml/xml_namespaces.asp

因此,在您的代码中,您需要先声明命名空间,然后才能进行任何 XPath 评估。我不知道如何在 Selenium Webdriver 中设置命名空间,但我猜你可以找到它。

声明命名空间后,您需要在 XPath 中使用它。例如,在 XSLT 中,您可以按如下方式声明名称空间:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:foo="http://schemas.datacontract.org/2004/07/myproj.cnn.com">

我现在用前缀声明了命名空间foo。可用于检索所有vList元素的 XPath 将是:

/foo:response/foo:results/foo:items/foo:vList

要获取displayName您可以使用的所有元素:

/foo:response/foo:results/foo:items/foo:vList/foo:displayName

如果你想要元素的总数而不是元素列表,你可以count()像这样环绕它:

count(/foo:response/foo:results/foo:items/foo:vList)
count(/foo:response/foo:results/foo:items/foo:vList/foo:displayName)

您使用的 XPath 包含很多//内容。仅//在确实需要时使用,因为如果您已经知道路径,它将扫描整个文件并占用比必要更多的资源。

于 2013-10-01T19:29:37.867 回答