1

我尝试使用 YQL 抓取一些网站(对于 Appcelerator Titanium 移动应用程序)。

我需要的数据在 A 标签内,但它的格式是:

<a href="...">
     <strong>Drugs</strong> and Culture</font>
</a>

所以,当我运行查询时:

select * from html where  url='...'  and xpath="//table[2]/tr/td[2]//a"

我得到:

 {"strong": "Drugs", "content": "\n and Culture"}

我需要 YQL 忽略那些“强”标签并以文本值响应:

{content: "Drugs and Culture"}

你知道怎么做吗?

4

1 回答 1

0

我不知道 YQL,但产生所需结果的纯 XPath 表达式是:

normalize-space(//table[2]/tr/td[2]//a)
于 2012-11-10T16:02:01.810 回答