问题标签 [goquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
78 浏览

goquery - 如何使用 goquery 获得 leetcode 排名

我想得到我的 leetcode 排名,但我对 html 和 JavaScript 了解一点。经过大量尝试,我得到了这个输出。

aQuaYi 的排名是 Ranking: {[{ pc.ranking }]}

来源是

请帮我完成这段代码,非常感谢。

0 投票
1 回答
1283 浏览

go - 无法从 *goquery.Selection 中选择直接子代

在 jQuery 和 CSS 中,您可以使用>仅指向直接子元素的字符。

这可以在Goquery中使用类似的东西doc.Find("body > ul"),但是当你已经有了 a*goquery.Selection并且你想选择选择的直接子元素时,如何做到这一点?

例如:

我想完成您期望从第二个代码块中选择的内容,但我没有取得任何成功。

如何才能做到这一点?

0 投票
1 回答
394 浏览

csv - 如何在 Go 中将结果输出到并发网络爬虫的 CSV?

我是 Go 新手,正在尝试利用 Go 中的并发性来构建一个基本的抓取工具,以从 URL 中提取标题、元描述和元关键字。

我能够以并发方式将结果打印到终端,但无法弄清楚如何将输出写入 CSV。我已经尝试了许多我可以在 Go 知识有限的情况下想到的变体,并且许多变体最终破坏了并发性 - 所以有点失去理智。

我的代码和 URL 输入文件如下 - 提前感谢您的任何提示!

带有 URL 的 data/sample.csv 输入文件:

0 投票
1 回答
133 浏览

go - 带有 goquery 的文档类型

是否有可能使用 goquery 检索文档文档类型?

我已经尝试了几件事,但任何一个都有效。我想这是可能的,因为 NodeName func 具有“html.DoctypeNode”案例的开关。

该代码没有找到文档类型:

0 投票
2 回答
1017 浏览

html - 使用 goquery 从网站检索文本

我有一个大致如下所示的 html:

我需要使用 goquery 从这个页面中获取尽可能多的信息。我知道如何提取在此片段中用“链接”一词替换的外部链接,我知道如何获取更多详细信息的链接,但我也想提取仅包含在文本中的信息,即年份(在标题中) ,运行时间,缩短描述和PG等级。我无法弄清楚如何在 goquery 中执行此操作,因为此文本没有被任何 div 或其他标签包围。我尝试寻找 h5 标签,然后在它们上调用 .Next() 但我只能找到<br>标签,而不是中间的文本。我怎样才能做到这一点?如果有比使用 goquery 更好的方法,我很好。我的代码看起来像这样。

0 投票
4 回答
1259 浏览

go - 使用 GoQuery 在换行符上拆分元素

我正在尝试使用 GoQuery 从页面中获取内容,但由于某些原因,我无法在换行符 (br) 上进行拆分。

HTML 看起来像这样:

去代码:

由于某种原因,我无法将每一行(由 p 标签中的 break 分隔)作为单个项目。上面的代码输出是:

但我试图实现的输出应该是这样的:

由于我是新手,如果有不清楚的地方,请在评论中告诉我,所以我会尽可能多地解释它。

谢谢。

0 投票
1 回答
199 浏览

go - Scraper 按文本查找元素

例如,我有下一张桌子

如何按文本查找元素,例如“第二”,然后获取值“2”?

当然,我可以做类似的事情

但也许还有另一种更简单的方法,一些特定的查找器?

0 投票
1 回答
179 浏览

go - http请求后如何得到响应

我正在学习围棋,是这个领域的真正新手。

当我尝试复制一些值时,我遇到了问题。

我正在做的是:

  1. 我想使用 httpRequest 在 [response] 中得到一些响应。
  1. 之后,我想将存储的值保存在“origin.txt”作为响应
  1. 我想通过使用 goquery 包来获得一个特定的值。

)

但在这种情况下,我可以从 2) 中得到我想要的值,但不能从 3) 中得到任何值。

起初,我认为问题在于,3) 处的响应对象受 2) 动作的影响。因为它是一个参考对象。

所以我试图将它复制到另一个对象,然后再做一次。

但是,我得到了与第一个相同的结果。

我应该怎么办?如何通过值将参考值分配给另一个参考值?

我应该为每次尝试请求两次吗?

0 投票
1 回答
312 浏览

html - 如何使用来自 RottenTomatoes 的 goquery 检索搜索列表?

我目前正在尝试从 RottenTomatoes 获取搜索列表以进行一些研究。我goquery以一种简单的方式集成了不同的站点。但烂番茄的情况就不一样了。即使我尝试了不同的查询方式,我也无法获得搜索列表。

测试网址:https://www.rottentomatoes.com/search/?search=test

我想得到的文字:Testament

doc.Text() 输出: https://pastebin.com/SsWHYXTH

电影

这是我所做的:

  • Expected:9(电影计数<section id="movieSection">

  • Actual:所有结果都返回 0。输出:000000000000000000000000

PS:当我通过 将结果打印到控制台时doc.Text(),整个页面都会正确显示。

按顺序打印所有电影名称:

0 投票
1 回答
1112 浏览

go - 如何使用 goquery 检索子元素的完整 HTML?

为什么以下测试失败?

这是测试结果:

换句话说,如果我无法预测该孩子是哪种 html 元素,我该如何检索第一个孩子的完整 HTML?