我尝试使用 YQL 抓取一些网站(对于 Appcelerator Titanium 移动应用程序)。
我需要的数据在 A 标签内,但它的格式是:
<a href="...">
<strong>Drugs</strong> and Culture</font>
</a>
所以,当我运行查询时:
select * from html where url='...' and xpath="//table[2]/tr/td[2]//a"
我得到:
{"strong": "Drugs", "content": "\n and Culture"}
我需要 YQL 忽略那些“强”标签并以文本值响应:
{content: "Drugs and Culture"}
你知道怎么做吗?