0

我正在尝试使用 YQL 解析页面。正在解析 HTML 表。问题是 YQL 自己添加了 HTML“p”标签,而它不包含在原始 HTML 中。应该怎么做才能使 YQL 不返回 HTML。

YQL 查询可以在这里看到。

如果在下面的 td 标签中查看,则包含 ap 标签,在原始 html 中可以看到这里在 table html 中没有 ap 标签。

<tr>
    <td class="ttl">
        <a href="#" onclick="helpW('h_weight.htm');">Weight</a>
    </td>
    <td class="nfo">
        <p>169 g</p>
    </td>
</tr>
4

1 回答 1

0

这样做的不是 YQL,而是 HTML5 引擎本身。HTML5 的部分理念是,如果您给它提供无效的 HTML,它会通过添加您错过的任何元素来为您修复它,并且您在查询中看到的是代表修复内容的树。(是的,这使得编写查询变得困难。但这不是一个分摊责任的地方......)

于 2012-08-13T20:59:57.807 回答