15

我有一个格式错误的页面要抓取,并且很难为 YQL 获取正确的 XPath。我可以抓取我需要使用的各个字段,例如:

//*[@id="cell_12345"]

但我真正需要做的是返回所有 ID 以cell_. 就像是:

//*[@id="cell_"*]

我该怎么做呢?

此外,如果有人能指出一个好的 XPath 参考资料,那将非常有帮助。

谢谢!

4

1 回答 1

29

就像是

//*[starts-with(@id, 'ceil_')]

应该做得很好。

至于 xpath 参考,一旦您知道语法和轴,任何旧函数参考都应该有所帮助。这是第一个谷歌:http ://www.w3schools.com/xpath/xpath_functions.asp

于 2010-04-01T05:21:01.590 回答