“pup”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

141 浏览

parsing - 如何使用 pup 限制标签级别的结果数量？

简而言之：

有没有办法使用pup来限制结果的数量，而不是整体，而是在标签级别？

背景故事/用例：

自从我了解小狗以来，我一直很着迷。我一直在思考新的用例。今天早上我想用它来获取ESPN的最新头条新闻。

ESPN 似乎有一个像这样的无序列表：<ul class="headlines">然后是一堆列表项。

一个简单的解决方案是：

正确的？但是，正如您所看到的，有时每行每个主题都有多个链接与备用作者，因此您最终会得到像“Low”、“Anande”、“Stark”和“Dinich”这样的结果（ESPN 的姓氏作者）。

理想情况下，我想做这样的事情：

但这只会返回第一个结果。:\

每个有多个<a>标签<li>，所以我想检索所有<li>项目，但将<a>标签数量限制为 1 个<li>。这可能吗？

2014-10-29T16:28:17.110

0 投票

1 回答

59 浏览

vb.net - VB,NET 程序被 McAfee 标记为 PUP

多年来，我一直通过 FTP 向我们的客户提供新版本的 VB.NET 程序。现在，其中一个程序被客户端阻止了 McAfee 防病毒女巫声称它是 PUP（可能不需要的程序）客户端可以下载的版本的唯一变化是它是为 64 位 CPU 编译的。

可以下载其他为 64 位编译的程序，其中只有一个被停止。有没有人知道如何获得您的列表程序？

/POE

vb.net mcafee pup

2018-07-05T21:23:24.633

0 投票

0 回答

1373 浏览

android - 使用 Unity3D 构建 APK 时的 PUP.HighConfidence

我在 Mac 中使用最新版本的 Unity。从它构建的 android apk 给了 PUP.HighConfidence，病毒在 virustotal.com 上被标记。我不知道这个问题的真正原因。我在 Windows 7 和 Windows 10 上遇到过类似的问题。谁能帮我知道我为什么会这样以及如何摆脱它？

谢谢

android unity3d apk pup

2018-07-25T05:16:38.907

0 投票

2 回答

38 浏览

javascript - 将对象数组转换为数组

我正在尝试将测试数组中每个对象的“count”键转换为一个新数组，所以我最终得到类似

新计数 =[0,0,0,0]

javascript arrays object pup

2018-11-17T23:32:00.880

0 投票

1 回答

806 浏览

html - 是否可以定义一个连接多个选择器并用分号分隔它们的 HTML 选择器？

我正在尝试使用pup解析一个简单的 HTML 页面。这是一个命令行 HTML 解析器，它接受一般的 HTML 选择器。

我要选择：

我还想选择：

我想连接它们并插入一些自定义文本以获得：

我想避免多次调用 pup ，因为它很慢。

我可以选择多个标签：

但这将导致：

为此目的，还有比小狗更好的选择吗？

（注意：Python 不是一个选项，因为它对我的需求来说非常慢。）

html bash pup

2019-01-04T17:53:11.243

0 投票

1 回答

298 浏览

html - 如何通过 pup 从下一行中选择值？

给定下表：

假设我不知道值的固定位置，我想通过给出第一行列名来选择第二行，例如：

富 => 1
酒吧 => 2
嗡嗡声 => 3

目前我知道如何获取列的名称（第一行）：

我知道如何通过以下方式返回下一列：

我希望通过以下方式获得下一行：

但它不返回任何东西（我希望是1）。

这是jQuery 的解决方案，但我希望该解决方案可以与pup命令一起使用。

我检查了Mozilla 的 CSS 选择器文档页面，但找不到合适的东西。

html html-table css-selectors pup

2019-03-22T01:07:12.710

0 投票

1 回答

302 浏览

http - 如何从网页中获取所有结果，就像浏览器在完成向下滚动时显示的那样

我正在尝试从网页获取所有视频结果：

另一种方法返回相同的结果：

编辑1：使用firefox将网页滚动到末尾并将其保存为c335170.html，我得到相同的结果：

但是，在网络浏览器上，滚动到最后，它会显示 81 个结果。

同样的铅。使用 YouTube 和隐藏来自 http 控制台客户端的结果的“加载更多”按钮：

编辑2：我刚刚用firefox将此网页保存为“网页，仅限HTML” RMC_IMPACTV__YouTube.html，然后：

我怎样才能让远程 HTTP 服务器给我所有的结果？

http curl wget pup

2019-04-30T02:31:46.353

0 投票

1 回答

487 浏览

bash - 查找一组文件夹中的所有 HTML 文件，提取特定的 HTML 内容并将内容保存到新文件

我有一个包含数千个 HTML 文件的文件夹结构，我想使用 pandoc 清理并转换为 markdown，但保留现有结构（或镜像结构）。

我目前已经设法使用找到所有 HTML 文件，使用解析内容并查看标记并将内容通过管道传递到名为 article-content.txt 的新文件的命令find传递该内容。catpup<article>

我正在考虑分两个阶段处理内容。

从每个文件中提取文章标签并保存为新文件（或覆盖现有文件）。
然后用 pandoc 转换相同的结构。

我对 bash 的理解是有限的。我知道我可能需要遍历文件列表并将路径/文件名作为变量传递给新的文件结构。但不确定下一步该去哪里。

bash pandoc pup

2019-10-08T15:54:22.143

0 投票

2 回答

3866 浏览

flutter - 我不能在颤振上使用 get 包

我从中克隆了这个应用程序github，当我尝试获取包时它给了我那个错误

因为my_flutter_ui_challenges依赖于fluttery_seekbar任何不存在的东西

fluttery_seekbar（在https://pub.dartlang.org找不到包），版本解析失败。

任何人都知道如何解决这个问题

flutter dart package pup

2019-12-12T21:00:33.737

0 投票

2 回答

1822 浏览

json - 如何使用 CLI 从 OK.ru/video 中提取视频 url 和标题

编辑 1：我想使用 CLI从“ https://ok.ru/video/c1404844 ”结果中提取视频网址和标题。

这是我到目前为止所做的事情：

每个视频相对 URL 的 ERE 模式是： /video/\d+视频绝对 URL 如下所示：https://ok.ru$videoRelativeURL

我可以使用这个命令来提取视频 url（我使用uniq是因为很多视频 ID 出现了 3 次）：

然后我尝试用pup提取视频 relativeURLs + 标题。

编辑 3：我将类名替换video-card_n ellip为video-card_n.ellip. 然而pup只输出第二类（video-card_n.ellip）的属性，奇怪：

它没有用，所以我使用以下命令将扩展的 html 转换为 json：

现在我想尝试使用jq工具从生成的 json 文件中提取titlefromvideo-card_n ellip和hreffrom ，但我知道如何使用足够多。video-card_lkjq

我想jq（或pup）输出一个平面文件：url 作为第一列，标题作为第二列。

编辑 2：非常感谢@peak 的帮助jq！

完毕：

json css-selectors jq pup

2020-04-16T23:25:53.167

问题标签 [pup]

Reference