问题标签 [goutte]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2596 浏览

php - 异步发送多个 goutte 请求

这是我正在使用的代码

这可行,但需要很多时间来处理?有什么方法可以更快地做到这一点。

0 投票
1 回答
581 浏览

php - filterXpath 和 filter 有什么区别?

我在学习 Goutte 时遇到了这些,但我不知道它们有什么不同?

0 投票
1 回答
278 浏览

php - 无法刮取的属性来自兄弟元素

我正在尝试使用 Symfony2、Goutte 和 DomCrawler 抓取一些数据。我有一个棘手的情况,我需要在<td>.

工作部分:

好吧,现在是:

我正在尝试更改选择器

知道如何继续遍历,以便我可以访问<input>它以获得它的属性 value="" 是什么?

0 投票
2 回答
1437 浏览

php - 使用 Goutte / Guzzle 和 Laravel 使用 CSRF 提交表单

我有两个网站(都是我的),我正在测试 Guzzle。

我正在尝试提交搜索表单。此搜索表单具有标准 Laravel CSRF 令牌隐藏字段,自动生成“_token”。

使用 gotte 提交字段时,会出现错误。检查我在网站上的日志,我可以看到它是 Laravel “TokenMismatchException”

我是否需要在 goutte 中做一些特别的事情以确保它发布自动生成的“_token”隐藏字段?

0 投票
1 回答
5299 浏览

php - 如何使用 Goutte Crawler 提取数据?

这段代码返回了内容的href,现在我想从这个href中提取内容并将其发送到我的视图。命名我需要提取的 div:



0 投票
1 回答
160 浏览

php - 让 Goutte 在共享主机上工作?

我使用 Composer 在本地主机上安装了 Goutte。使用 XAMPP 运行时,它按预期工作。然后,我将供应商文件夹中的所有文件上传到服务器。现在,脚本显示如下错误:

语法错误,在第 68 行的 vendor/react/promise/src/functions.php 中出现意外的 '[',期待 ')'

该文件无需在本地主机上进行任何修改即可完美运行。可能的原因是什么?

0 投票
1 回答
5806 浏览

php - 如何使用 Goutte 提交表单并获取最终 URI?

目的是form[id=thisAwesomeRemoteForm][action=#]在远程网站上填充 a。只有一个字段 ( input[name=awesomeField]) 需要填充,然后需要提交表单。作为最终要求,用户需要从我的网站重定向到这个远程网站,就好像它已经在远程网站上提交了表单一样。

长话短说,我需要用户能够点击我的链接,让 PHP 完成这项工作并被重定向到这个远程网站,就好像它已经填写并提交了远程网站上的表单一样。我不必让用户自己填写远程表单。

到目前为止的代码是:

到目前为止,我被重定向到第一个 URL 所在的form位置,而不是form应该指向的位置。但是,该字段填充了正确的数据。

我的代码是否正确以实现我的目的(因此,它是可能使用 JavaScript 发送表单或其他内容的远程网站)还是我遗漏了一些相当明显的东西?

0 投票
0 回答
92 浏览

php - 无法使用 symfony 从 HTML 文档中提取预期部分?

我正在尝试使用 symfony DOM 爬虫解析这部分 HTML。

我只想提取这部分:

我已经尝试了很多东西,比如

有什么办法可以得到我上面提到的部分。到目前为止,我写的任何东西都不起作用。要么我在底部得到一些额外的图像和链接,要么我留下一些我打算获得文章链接的部分。

任何帮助,将不胜感激。

0 投票
0 回答
799 浏览

php - Goutte无法点击链接

我不确定这里发生了什么,我正在使用 Goutte 进行爬网,试图爬取 exploitdb 上的所有漏洞,但显然我无法单击 1 个特定链接。这是代码:

输出是“diff”,显然字符串与我直接从网站复制粘贴时的字符串相同,但事实并非如此,这只发生在这个特定的字符串上,我也使用了这个函数:

但没有成功。

会发生什么?

0 投票
1 回答
2885 浏览

php - 如何在 Goutte 中下载图像

我想在这个页面下载一张图片。图片来源是http://i2.pixiv.net/c/600x600/img-master/img/2015/01/19/12/17/13/48258889_p0_master1200.jpg。我尝试下载它使用这个:

但是我失败了,然后我意识到如果我直接访问http://i2.pixiv.net/c/600x600/img-master/img/2015/01/19/12/17/13/48258889_p0_master1200.jpg,我会被 CDN nginx 服务器拒绝。我必须在“www.pixv.net”页面访问此图片链接,这意味着我的图片请求参考是“www.pixv.net”。如何在 Goutte 中做到这一点?