我有一个网页,我正在从(或至少尝试)抓取表单字段。我正在使用Symfony2
(and Goutte
) 来执行此操作,所以我有一个$crawler
对象。这是下面的 html 示例:
<html>
<body>
... other html stuff ...
<form method="post" action="goSomewhere">
<table>
<tr><td><input type="checkbox" name="123">Stuff 1</td></tr>
<tr><td><input type="checkbox" checked name="456">Stuff 2</td></tr>
<tr><td><input type="checkbox" name="789">Stuff 3</td></tr>
</body>
</html>
如您所见,有很多嵌套内容。我的兴趣只是<input>
标签内的<form></form>
标签。
我正在尝试类似的事情:
$query = "//form/input";
$inputs = $crawler->filterXPath($query);
但它似乎并没有得到所有(并且只有)输入标签。我做了一个->count()
,当有更多的 50-100 个输入标签时,我只得到 8 作为数字。
谁能帮我得到正确的查询来做到这一点?
此外,一旦我有兴趣删除特定的输入。Dom 中是否有一种方法Crawler
可以让我这样做?我环顾了很多地方,找不到太多。也许如果我做一个反向过滤系统?
谢谢你的帮助!