问题标签 [extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
253 浏览

javascript - 调用时的Javascript函数参数名称?

我知道这是一个长的镜头,但我想我会问:有没有办法找到在函数调用中作为参数传递的变量的名称?

假设我有:

我想得到一个像这样的数组:[a, b]. 字符串也可以接受:["a", "b"].

想要["tmp1", "tmp2"],我知道我可以通过解析函数的字符串表示来获得。

我之所以问,是因为我正在尝试使用真正的提取器改进我的caseclass.js库(有关更多信息,请参见链接)。我知道只有对象是通过引用传递的,所以我试图找到一种解决方法,将提取的值传递回占位符变量。

谢谢!

0 投票
3 回答
6152 浏览

python - 如何通过 python 从 mediawiki 标记文章中解析/提取数据

来源 Mediawiki 标记

现在,我正在使用各种正则表达式将 mediawiki 标记中的数据“解析”为列表/字典,以便可以使用文章中的元素。

这几乎不是最好的方法,因为必须制作的案例数量很大。

如何将一篇文章的 mediawiki 标记解析为各种 python 对象,以便可以使用其中的数据?

示例是:

  • 将所有标题提取到字典中,并与其部分进行散列。
  • 获取所有跨维基链接,并将它们粘贴到一个列表中(我知道
    这可以通过 API 完成,但我宁愿只调用一个 API 来
    减少带宽使用)。
  • 提取所有图像名称并将它们与它们的部分一起散列

各种正则表达式可以实现上述目的,但我发现我必须使数字相当大。

这是mediawiki 非官方规范(我不认为他们的官方规范有用)。

0 投票
3 回答
81628 浏览

python - 从引号之间提取字符串

我想从用户输入的文本中提取信息。想象一下,我输入以下内容:

如何在第一组报价之间提取信息?那么第二个呢?那么第三个呢?

0 投票
2 回答
22267 浏览

python - 如何使用 lxml、XPath 和 Python 从网页中提取链接?

我有这个 xpath 查询:

它提取所有带有 title 属性的链接 - 并hrefFireFox 的 Xpath 检查器插件中提供

但是,我似乎无法将它与lxml.

lxml这不会从(空列表)产生任何结果。

如何在 Python 下获取href包含属性标题的超链接的文本(链接) ?lxml

0 投票
3 回答
20189 浏览

android - 在 Android 中提取视频帧

我想知道是否可以从 Android 中正在运行的视频中提取帧?我需要定期提取帧并将它们发送以进行进一步处理。

有人能为我找到答案吗?

谢谢,

阿比

0 投票
2 回答
3097 浏览

c# - 如何从 Vista/7 可执行文件中提取完整图标?

如果我有一个包含 16x16、32x32、256x256 等版本图标的 Vista .ico 文件,我可以通过简单地执行以下操作成功地将其加载为 .NET 图标:

然后我可以访问图标中所有不同大小的图像。我什至可以使用此处详述的方法访问 256x256 Vista PNG 。

但是,我还没有找到从 Vista 可执行文件中获取全套图标图像的方法。不幸的是,这样做-:

...仅会导致提取单个 32x32 图像。有没有办法从可执行文件中获取整组图像作为 .NET 图标?最好是也可以在 XP 中使用的。

0 投票
2 回答
1234 浏览

extraction - 如何将可缩放图像捕获为一张高分辨率图像?

我想以 3 倍的高分辨率捕捉可缩放的图像。你知道我无需手动就可以将这张图片拼凑在一起的方法吗?这是图像

0 投票
1 回答
403 浏览

solr - 如何让 Solr Extraction Handler 提取多个同名的 META 标签?

我正在将一些 HTML 文档上传到 SOLR 提取处理程序(Solr-Cell),该处理程序的头部有 META 元素,格式如下:

我的架构将产品定义为多值字段:

我希望将这两种产品都添加到该字段中的索引中。不幸的是,出了点问题 - 只有最后一个产品被成功记录。

谁能告诉我如何让它工作,谢谢:)

0 投票
1 回答
403 浏览

windows - 使用 Python 或其他常用脚本语言/工具以编程方式获取 DLL 清单信息

我遇到了这样的问题:

http://svn.haxx.se/tsvnusers/archive-2008-07/1051.shtml

除了该应用程序是我们自己的(对不起,不会给你保密的细节)。尽管如此,SideBySide 的缺陷并不是我们的错。

无论如何,版本 X 有效,版本 Y 在一开始就轰炸了。我面临着遍历一堆目录和多达 100 个 dll 文件的任务,以找出可能存在的差异。

看起来两个 dll 文件之间存在冲突,它们加载了另一个 dll 文件的两个不同版本。

感谢您对 Python / 其他片段的帮助,以从给定文件中提取清单。谢谢!

编辑:顺便说一句,我确实找到了一种方法:我可以运行以下命令(mt.exe 是 Visual Studio 2008 工具的一部分)mt.exe -inputresource:MyFile.dll;#2 -out:MyFile.dll.extracted_manifest.txt:.

这是一个好的开始,但有两个问题:

  1. 可以嵌入多个清单(在我的理解中):#1、#2、#3,... - 我不知道哪些清单和多少提前。最大值是多少?
  2. 如果我猜测并使用该参数运行 mt.exe,我会失败。处理这些错误会使脚本变长。

有人可以对此有所了解吗?

另一个编辑:啊,没关系!1 用于 .exe,2 用于 dll,仅此而已。我想我现在知道该怎么做了。但是,如果您有比我更好的解决方案,或者如果您从 Python / 其他脚本自动调用 mt.exe,那么请随时分享。

0 投票
4 回答
985 浏览

c++ - 从不遵循特定格式的字符串中提取数字和字符?(后缀计算器)

我无法从输入字符串中分离数字和字符。我的程序的目的是在后缀中加、减、乘和除, 所以我无法预测输入形式,因为它可以是从 2 2 3 + *(答案是 10)2 2 + 3 *(答案是 12)的任何东西. 所以我不能使用 sscanf 来提取数字和运算符字符,而不需要输入字符串的特定格式。我应该在这里做什么?