问题标签 [domcrawler]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2391 浏览

symfony - 使用 symfony domcrawler 获取选择选项值列表

在单元测试中,我想获取选择选项值的列表。

我的页面包含一个带有下拉列表的表单

在我的单元测试中,

form2->html() 和 form2->text() 为我提供了表单按钮的详细信息。

0 投票
2 回答
3867 浏览

php - 如何使用 symfony 的 DomCrawler 组件更新选定的 Dom 元素?

如何使用 symfony 的 DomCrawler 组件更新选定的 Dom 元素?

0 投票
1 回答
1388 浏览

php - 在提交之前向 Symfony 表单添加额外的字段

我正在使用 Goutte,https://github.com/fabpot/goutte,并有以下代码,

如何在提交之前将隐藏的输入字段添加到表单中?

我尝试了以下代码,

但返回以下错误信息,

InputFormField 只能从输入或按钮标签(给定 __EVENTTARGET)创建。

0 投票
0 回答
935 浏览

php - 在 PHP 中使用 Goutte 抓取 AJAX 页面

我正在尝试使用Goutte和 Symfony Dom Crawler 爬取 AJAX 网站,以便为我们的在线商店获取一些文章。我得到错误:

未定义索引:HTTP_ACCEPT_LANGUAGE

地址是http://b2b.asicsonline.com/adg/welcome

我无法获取表格或在网站上登录。你能告诉我可能是什么问题吗?

0 投票
2 回答
1602 浏览

symfony - 使用 DomCrawler 检查表行

我正在编写一个 phpunit 测试...在我的页面上我有几行,其中之一是这样的:

有些是这样的:

如何运行测试以检查带有图钉字形图标的行是否是带有“匹配”的行?

基本上我希望测试确认字形图标出现在正确的行上,并且只有类似的东西$crawler->filter('small:contains("' . $glyphCode . '")')->count()才能确认字形存在 - 而不是它在正确的位置。

任何帮助表示赞赏,谢谢。

0 投票
1 回答
808 浏览

php - Symfony DomCrawler

我在 Symfony 中使用 DomCrawler。

我尝试访问函数内部的变量,但出现错误:未定义的变量。

如何在函数内部调用此变量?

0 投票
0 回答
336 浏览

php - 如何为 Symfony DomCrawler 设置身份验证详细信息?

我正在尝试抓取一些需要身份验证的网页,即首先您应该登录,然后您才能访问这些页面。

为此,我试图Symfony\Component\DomCrawler\Crawler在我的应用程序中使用(我没有使用 Symfony 框架,我symfony/dom-crawler使用过 Composer)。

这对于简单的页面非常有效,但不适用于经过身份验证的页面,即需要用户名和密码的页面。因此,我正在尝试使用Symfony 网站上的此页面并插入此代码:

但我得到了这个:

为了解决这个问题,我添加phpunit.xmlpath/to/my/project/phpunit.xml以下内容:

如果我输入命令提示符phpunit,我会得到:

这表明 phpunit 知道 phpunit.xml 文件,但错误仍然存​​在。

更新:目的不是将此程序用作单元测试或任何其他测试的一部分,此目的是通过任何可能的解决方案来抓取页面。

0 投票
1 回答
2929 浏览

php - 在 PHP 中使用 DOMCrawler 从下拉框中选择一个选项

我在 PHP 中使用 DOMCrawler。我有下面的 HTML。我需要能够选择“Text1”选项,然后提交表单。我有以下代码,但我似乎无法让它工作......我做错了什么?

这是 HTML:

0 投票
1 回答
1684 浏览

php - DOMCrawler 查找带有内部 HTML 文本的标记

我正在尝试使用 Goutte 抓取网页,但找不到DOMCrawler搜索实际文本的方法。假设有一个td,但它没有类或 ID。所以,我需要搜索让我们说“标题”,然后得到td下一个兄弟。

0 投票
2 回答
474 浏览

php - DOMCrawler not dumping data properly for parsing

I'm using Symfony, Goutte, and DOMCrawler to scrape a page. Unfortunately, this page has many old fashioned tables of data, and no IDs or classes or identifying factors. So I'm trying to find a table by parsing through the source code I get back from the request, but I can't seem to access any information

I think when I try to filter it, it only filters the first node, and that's not where my desired data is, so it returns nothing.

so I have a $crawler object. And I've tried to loop through the following to get what I want:

I'm not sure what Crawler $node, I just got it from the example on the web page. Perhaps if I can get this working, then it will loop through each node in the $crawler object and find what I'm actually looking for.

Here's an example of the page:

And this is just one table, there are many tables and a huge sloppy mess outside of this one. Any ideas?

(Note: earlier I was able to apply a filter to the $crawler object for some information I needed, then I serialize() the information, and has a string finally, which made sense. But I cannot get a string at all anymore, idk why.)