嘿,我想使用 YQL 从我的博客中抓取一些数据:
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']"
如何在查询中使用不同的 xpath 位?例如,我可以做类似的事情:
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']" AND xpath ="//div[@class='title']"
假设我想获得帖子和标题?我想我可以接受所有的 HTML,但我宁愿只接受我需要的内容,因为这里的速度是一个问题。
一旦我有了想要从标记中提取文本的 HTML,是否可以为此使用 PHP 正则表达式?
我也了解您可以使用 CSS 语法,如果您有使用 YQL 的经验,并且可以指导我如何编写与上述查询类似的查询,但使用 CSS 而不是 XPATH,我将不胜感激!
谢谢。