使用XpathBuilder,我可以构建一个简单的搜索引擎查询并使用 XPath 从搜索结果中提取数据。我在这里的 Google Doc 电子表格中有一些简单的示例,它在各种搜索引擎上运行查询“XPath 教程”并尝试提取每个搜索引擎返回的结果数量。
该 Google Doc 中的代码如下:
=importxml("http://www.google.com/search?q="xpath+tutorial"&num=30&pws=0",
"//div[@id='resultStats']")
=importxml("http://www.bing.com/search?q=xpath+tutorial&count=30",
"//span[@class='sb_count']")
=importxml("http://search.yahoo.com/search?p=xpath+tutorial&n=30",
"//span[@id='resultCount']")
这有一些我不明白的奇怪之处。首先,Google 搜索没有返回任何结果,但 XPath 查询看起来不错。确实,有许多在线教程可以准确地推荐我在这里所做的事情。
雅虎查询返回正确的结果,它是唯一的。
Bing Xpath 查询找到的结果数量与Bing 网页上给出的结果不匹配,即使只有一个 XML 节点与 XPath 查询匹配。更多详细信息请参见此处的电子表格
哪里出了这么大的问题?