问题标签 [extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1196 浏览

python - 如何通过 Python 从地理数据中提取 x、y 和 z 坐标?

我有包含 14 个变量的地理数据。数据格式如下:

Quadname:RockPort_Colony_SD分辨率:10 ULLAT:43.625
ULLON:-97.87527466 LRLAT:43.5
LRLON:-97.75027466 HDATUM:27
ZMIN:361.58401489 ZMAX:413.38400269 ZSIGMA:396.1293335 Zsigma:12.36359215 PMethod:5
Quaddate:20001001

整个数据在序列中有许多先前的变量。

如何从数据中提取坐标 ULLAT、ULLON 和 LRLAT 到三个列表中,以便每一行对应一个位置?

这个问题是由帖子中的问题提出的。

0 投票
3 回答
6347 浏览

parsing - QTP:获取电子邮件中所有链接的列表

我正在 Mercury/HP QuickTest Pro 9.1 中“开发”一个测试计划,我必须在其中提取电子邮件中所有链接的列表并对每个链接执行逻辑。

在这种情况下,我使用的是 Webmail,因此邮件将显示为网页;虽然我希望以后使用 Outlook 来复制更真实的 UX。

我是开发人员,而不是测试人员。任何人都可以为我提供一些将执行此提取的“代码”吗?

0 投票
2 回答
51565 浏览

exe - EXE提取/反编译器

我尝试了一些 EXE 提取器,但它们不适用于很多文件。我正在寻找更好的东西。

0 投票
4 回答
1883 浏览

web-crawler - 用于抓取和挖掘网站数据的最佳开源库或应用程序

我想知道用于抓取和分析网站的最佳 eopen-source 库是什么。一个例子是爬虫物业机构,我想从多个站点获取信息并将它们聚合到我自己的站点中。为此,我需要抓取网站并提取物业广告。

0 投票
4 回答
1163 浏览

perl - 如何从字符串中提取一堆数字?

这是示例测试文件:

所以,在这个文件中,如何搜索单词 Barcode 并提取它的前五位数字,同时将它传递到一个数组中。

提前致谢。

0 投票
4 回答
54348 浏览

c# - 正则表达式 C# - 匹配时是否可以提取匹配项?

说,我有一个字符串,我需要验证其正确格式;例如RR1234566-001(2 个字母,7 个数字,破折号,1 个或多个数字)。我使用类似的东西:

这可以告诉我是否stringToMatch遵循patternString. 我需要的是(我稍后会提取这些)是: 123456001- 即stringToMatch.

请注意,这不是关于如何构造正则表达式的问题。我要问的是:“有没有一种方法可以同时匹配和提取值,而不必稍后使用拆分函数?”

0 投票
1 回答
467 浏览

c - 如何从 C 中的 WBC 文件中提取图片?

有人请我帮助他们从 Web Shots 图像收集文件 (.WBC) 中提取图片。我试过 XnView 但它没有用。我怎样才能在 C 中做到这一点?

0 投票
1 回答
332 浏览

c# - 使用托管代码提取 Exchange 邮件附件

有没有人知道一种方法可以在邮件从 Exchange 2003 到达时将特定扩展名的邮件附件复制到使用托管代码的共享目录中?

我知道一种方法是使用 vbscript,使用交换暴露的接收器。但是我想知道是否有人看过托管代码中的示例,可能使用互操作?

非常感谢任何示例代码。

0 投票
20 回答
867523 浏览

python - 如何从多维数组中提取一列?

有人知道如何从 Python 中的多维数组中提取一列吗?

0 投票
7 回答
84619 浏览

pdf - 如何从 PDF 文件中提取数据,同时跟踪其结构?

我的目标是从 PDF 文件中提取文本和图像,同时解析其结构。解析结构的范围并不详尽;我只需要能够识别标题和段落。

我尝试了一些不同的东西,但我在其中的任何一个中都没有走得太远:

  • 将 PDF 转换为文本。它对我不起作用,因为我丢失了图像和文档的结构。
  • 将 PDF 转换为 HTML。我找到了一些可以帮助我解决这个问题的工具,迄今为止最好的工具是 pdftohtml。该工具在演示方面非常出色,但我无法成功解析 HTML。
  • 将 PDF 转换为 XML。和上面一样。

有人对如何解决这个问题有任何建议吗?