问题标签 [pup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
parsing - 如何使用 pup 限制标签级别的结果数量?
简而言之:
有没有办法使用pup来限制结果的数量,而不是整体,而是在标签级别?
背景故事/用例:
自从我了解小狗以来,我一直很着迷。我一直在思考新的用例。今天早上我想用它来获取ESPN的最新头条新闻。
ESPN 似乎有一个像这样的无序列表:<ul class="headlines">
然后是一堆列表项。
一个简单的解决方案是:
正确的?但是,正如您所看到的,有时每行每个主题都有多个链接与备用作者,因此您最终会得到像“Low”、“Anande”、“Stark”和“Dinich”这样的结果(ESPN 的姓氏作者)。
理想情况下,我想做这样的事情:
但这只会返回第一个结果。:\
每个有多个<a>
标签<li>
,所以我想检索所有<li>
项目,但将<a>
标签数量限制为 1 个<li>
。这可能吗?
vb.net - VB,NET 程序被 McAfee 标记为 PUP
多年来,我一直通过 FTP 向我们的客户提供新版本的 VB.NET 程序。现在,其中一个程序被客户端阻止了 McAfee 防病毒女巫声称它是 PUP(可能不需要的程序)客户端可以下载的版本的唯一变化是它是为 64 位 CPU 编译的。
可以下载其他为 64 位编译的程序,其中只有一个被停止。有没有人知道如何获得您的列表程序?
/POE
android - 使用 Unity3D 构建 APK 时的 PUP.HighConfidence
我在 Mac 中使用最新版本的 Unity。从它构建的 android apk 给了 PUP.HighConfidence,病毒在 virustotal.com 上被标记。我不知道这个问题的真正原因。我在 Windows 7 和 Windows 10 上遇到过类似的问题。谁能帮我知道我为什么会这样以及如何摆脱它?
谢谢
javascript - 将对象数组转换为数组
我正在尝试将测试数组中每个对象的“count”键转换为一个新数组,所以我最终得到类似
新计数 =[0,0,0,0]
html - 是否可以定义一个连接多个选择器并用分号分隔它们的 HTML 选择器?
我正在尝试使用pup解析一个简单的 HTML 页面。这是一个命令行 HTML 解析器,它接受一般的 HTML 选择器。
我要选择:
我还想选择:
我想连接它们并插入一些自定义文本以获得:
我想避免多次调用 pup ,因为它很慢。
我可以选择多个标签:
但这将导致:
为此目的,还有比小狗更好的选择吗?
(注意:Python 不是一个选项,因为它对我的需求来说非常慢。)
html - 如何通过 pup 从下一行中选择值?
给定下表:
假设我不知道值的固定位置,我想通过给出第一行列名来选择第二行,例如:
- 富 => 1
- 酒吧 => 2
- 嗡嗡声 => 3
目前我知道如何获取列的名称(第一行):
我知道如何通过以下方式返回下一列:
我希望通过以下方式获得下一行:
但它不返回任何东西(我希望是1
)。
这是jQuery 的解决方案,但我希望该解决方案可以与pup
命令一起使用。
我检查了Mozilla 的 CSS 选择器文档页面,但找不到合适的东西。
http - 如何从网页中获取所有结果,就像浏览器在完成向下滚动时显示的那样
我正在尝试从网页获取所有视频结果:
另一种方法返回相同的结果:
编辑1:使用firefox将网页滚动到末尾并将其保存为c335170.html
,我得到相同的结果:
但是,在网络浏览器上,滚动到最后,它会显示 81 个结果。
同样的铅。使用 YouTube 和隐藏来自 http 控制台客户端的结果的“加载更多”按钮:
编辑2:我刚刚用firefox将此网页保存为“网页,仅限HTML” RMC_IMPACTV__YouTube.html
,然后:
我怎样才能让远程 HTTP 服务器给我所有的结果?
bash - 查找一组文件夹中的所有 HTML 文件,提取特定的 HTML 内容并将内容保存到新文件
我有一个包含数千个 HTML 文件的文件夹结构,我想使用 pandoc 清理并转换为 markdown,但保留现有结构(或镜像结构)。
我目前已经设法使用 找到所有 HTML 文件,使用解析内容并查看标记并将内容通过管道传递到名为 article-content.txt 的新文件的命令find
传递该内容。cat
pup
<article>
我正在考虑分两个阶段处理内容。
- 从每个文件中提取文章标签并保存为新文件(或覆盖现有文件)。
- 然后用 pandoc 转换相同的结构。
我对 bash 的理解是有限的。我知道我可能需要遍历文件列表并将路径/文件名作为变量传递给新的文件结构。但不确定下一步该去哪里。
flutter - 我不能在颤振上使用 get 包
我从中克隆了这个应用程序github
,当我尝试获取包时它给了我那个错误
因为my_flutter_ui_challenges
依赖于fluttery_seekbar
任何不存在的东西
fluttery_seekbar
(在https://pub.dartlang.org找不到包),版本解析失败。
任何人都知道如何解决这个问题
json - 如何使用 CLI 从 OK.ru/video 中提取视频 url 和标题
编辑 1:我想使用 CLI从“ https://ok.ru/video/c1404844 ”结果中提取视频网址和标题。
这是我到目前为止所做的事情:
每个视频相对 URL 的 ERE 模式是:
/video/\d+
视频绝对 URL 如下所示:https://ok.ru$videoRelativeURL
我可以使用这个命令来提取视频 url(我使用uniq
是因为很多视频 ID 出现了 3 次):
然后我尝试用pup提取视频 relativeURLs + 标题。
编辑 3:我将类名替换video-card_n ellip
为video-card_n.ellip
. 然而pup
只输出第二类(video-card_n.ellip
)的属性,奇怪:
它没有用,所以我使用以下命令将扩展的 html 转换为 json:
现在我想尝试使用jq工具从生成的 json 文件中提取title
fromvideo-card_n ellip
和href
from ,但我知道如何使用足够多。video-card_lk
jq
我想jq
(或pup
)输出一个平面文件:url 作为第一列,标题作为第二列。
编辑 2:非常感谢@peak 的帮助jq
!
完毕 :