问题标签 [goose]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
71 浏览

python - Python Goose-extractor 在 tmp 中创建一个名为 goose 的文件夹,并用文件填充它

我正在使用 goose-extractor 从字典键中解析 url 列表。我正在使用 python 2.7.6 我的代码如下:

Goose 似乎正在 tmp 中创建一个名为 goose/ 的文件夹,它正在用 tmp 文件填充它,并且它已经填满了我的系统空间。我不希望这让我的系统崩溃。我做错了什么,垃圾收集没有正确发生。

0 投票
1 回答
332 浏览

pcap - 如何从 C# 授予 Windows 10 中 Pcap 库的权限?

我使用 SharpPcap 库来实现 GOOSE 协议侦听器(EtherType = 0x88B8)。它运行良好,但前提是我并行运行 Wireshark,否则我的程序不会捕获 GOOSE 数据包。

SharpPcap 示例也不会在 Wireshark 未运行时捕获 GOOSE 数据包。但是 SharpPcap 库会捕获我的广播 UDP 数据包。

0 投票
2 回答
1552 浏览

postgresql - Postgres 更改索引与删除索引并创建索引

我必须编写一个迁移命令来从索引中删除一列。目前让我们说我有table1索引col1 and col2

我想col1从索引中删除。我正在查看https://www.postgresql.org/docs/9.4/static/sql-alterindex.html但似乎我实际上不能只删除一列?

如果是,是否最好删除该列以及如何 VS

  • 创建新索引
  • 删除旧索引

另外,如果我需要降级,我想做相反的事情。所以只是想知道如何实现这一点

0 投票
2 回答
251 浏览

mms - 支持 MMS 和 GOOSE 驱动程序的 ScadaLTS 功能

我正在做一个项目来使用 SCADA 系统监控我的虚拟 IED。但是,我想用来传输信息的驱动程序是 MMS 或 GOOSE。那么 ScadaLTS 是否支持 IEC 60870-5-104 (MMS) 和 IEC 61850 (GOOSE)?如果没有,您有什么建议可以缓解这个问题吗?

0 投票
1 回答
277 浏览

python - 在 Python3 中替换 Goose?

我尝试为我的 python/flask 项目安装 Goose-extractor,但它给出了错误消息:

看来 Goose 不支持 Python3,那我可以用什么库代替呢?

0 投票
1 回答
270 浏览

python-2.7 - Python Goose extractor - “KNOWN_ARTICLE_CONTENT_TAGS” 流程似乎无效

将 python goose2 用于 python 2.7 。

您将KNOWN_ARTICLE_CONTENT_TAGS 要提取的文章的标签/类或 id 放在哪里,似乎不起作用。

比如说,把里面的默认标签作为

现在我的第一个问题是采用这些值的确切预期逻辑是什么?

  • 它是否认为这些文本中的所有文本都是默认文本?
  • 它们是否只是作为 goose 的参考来增加这些节点内的文本分数但不能保证所有内容都会显示?
  • goose 是否忽略其他常见的通用标签只考虑这些标签?
  • 我看到如果它返回 true ,它会跳过添加兄弟姐妹,这是什么意思?

但是经过一些调试,我发现提到的标签内的文本没有任何特殊的偏好,事实上,不调用已知的文章代码具有完全相同的输出,并且在某些来源使用已知标签时图像提取失败。原因。

同样在进一步挖掘后,我看到了该功能

article.doc 对似乎没有任何标签的对象进行操作。

几乎所有帖子上的这个也只返回带有文章标签的元素,而不是带有属性itemprop = articleBody的元素, 即使文章有它们。

从下面的代码中可以看出调试is_articlebody功能

我注意到,即使目标提取文档中有类似的标签/类,此函数也从未返回 true。

吨 该行print self.parser.getAttribute(node, item['attr'])始终返回为 null 。

我怎样才能让 goose 获取已知列表中提到的那些属性/类/标签中的所有文本,就像上面的示例一样,我想获取多个 p 标签内的所有文本(可以是除 p 之外的其他标签),不管分数 ?

编辑:在尝试进一步调试时,我意识到get_known_articles_tags函数只返回在字典中找到的第一个找到的标签/属性,关注:return nodes[0]

所以它只返回文档的那个单个节点,然后它只发送那个节点对象来找到顶部节点——假设节点不满足好/顶部节点的条件,那么它返回为空,因此失败。

我如何组合nodes列表中的所有节点对象,并将所有节点作为文档发送以解析并使用它来查找顶部节点?

0 投票
1 回答
49 浏览

python - 如何从用户定义的标签中获取href标签

有人可以帮我从 https://www.cnoocltd.com/col/col32091/index.html获取所有 href 标签

我将这个 url 加载到 goose 并将 html 内容加载到 Beautifulsoup。检查 html 标签,发现所有 a href 标签都在“datastore”中,这是一个自定义标签。我们如何通过beautifulsoup 提取href

0 投票
0 回答
103 浏览

go - 如何修复错误“EnsureDBVersion() 失败”

我有Go项目。我使用goose将迁移与数据绑定。安装后,我创建文件 .sql 并对其进行测试。但它不起作用。 在此处输入图像描述

我应该怎么办?

0 投票
0 回答
70 浏览

sql - 使用 goose 进行迁移版本控制的问题

pressly/goose在我的项目中使用,但我在版本控制迁移中遇到了冲突。默认情况下,goose 使用当前时间戳创建迁移文件。例如202105211346_users.sql,没关系。但是,如果有人比我更早地创建了迁移文件,并且当我们尝试应用另一个迁移文件(之前创建的)时我的迁移已经应用,那么该文件将不适用于数据库,因为它是更早创建的,并且它的时间戳比我的文件更小. 好的。我使用混合迁移解决了这个问题,当时间戳到达特定分支(开发)时使用 CI 转换为序列号。所以现在我们有这个:202105211346_users.sql->01_users.sql. 好吧,这很酷。但是我们还有另一个分支(阶段),我们可以将 smth 推送到阶段通过的开发分支,但我们也可以绕过开发分支进行推送。因此,当文件01_users.sql已经存在于开发分支(序列号 01)中,并且有人将文件推送到202105211347_cars.sql转换为01_cars.sql(也是序列号 01)的阶段分支时,我们可能会遇到这种情况,在下一步我们合并develop- >stage并且 CI 尝试应用使用鹅迁移。提醒我们01_user.sql在数据库中,现在 CI 尝试申请01_car.sql,这个文件有相同的序列号和 goose throw panic: goose: duplicate version。我该如何解决这个问题?

0 投票
1 回答
219 浏览

go - 使用 goose 进行数据库迁移时回滚

我正在使用这种鹅味。我希望我的迁移脚本在出现错误时回滚。把我的陈述包装在里面-- +goose StatementStart-- +goose StatementEnd对我不起作用。

这导致Error 1064: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'UPDATE....

鹅有可能吗?还是我只需要在一个迁移文件中编写一个查询?