问题标签 [extract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1625 浏览

java - 从字符串中的htmlsource中提取div内容(Java)

我正在尝试从包含 html 源的字符串中提取特殊 div-tag(由他的类名定义)的内容。我认为 Java 的正则表达式功能不像 perl 那样易于使用,对吧?

有没有人这样做过,可以给我一段代码?也许 dom-browsing 是一个很好的解决方案,但我没有找到任何与我的问题相匹配的教程。

0 投票
3 回答
642 浏览

php - 正则表达式语法在PHP中提取格式的所有实例

我正在尝试从字符串中提取特定格式的所有实例:

我想知道我的新索尼 [PT# 123456ABC; Sony] 有这个功能,但我的朋友说是新的 Toshiba [PT# AD-3232hjk; 东芝]有这个功能。

我想提取:

[PT# 123456ABC;索尼]

[PT# AD-3232hjk;东芝]

正如您在此处看到的,唯一处于一致位置的项目是:

  • [PT#
  • ;
  • ]

我试图使用各种类型的 strpos() 但由于部件号和制造商名称的长度和格式不同,我无法可靠地从更大的字符串中提取这些实例。我一直在尝试各种方法来使用正则表达式来解决这个问题,但是我对它们的了解相当有限。在我将这些表达式提取并放入变量后,我需要将部件号和制造商名称与表达式分开。这也可能更容易使用正则表达式来完成。

任何帮助表示赞赏。谢谢

0 投票
1 回答
3201 浏览

c# - 从 SWF 中提取文本

我们目前使用 print2flash ( http://print2flash.com ) 将用户提交的文档(Word 文档、RTF、PowerPoint 等)转换为可以在线查看的基于 Flash 的文档(a la docstoc 和 scribd)。

我们希望对这些文件中的文本进行索引以进行全文索引。我们可以使用任何工具或库来完成此任务吗?

我们正在使用 ASP.NET / C# 进行开发,并尝试使用 SWFTools ( http://www.swftools.org ) 等 3rd 方工具,但结果不一致且低于标准。

PS:我们希望在将原始文档转换为 Flash 之后进行索引,因为这样可以减少我们需要处理的文件格式。

0 投票
15 回答
330966 浏览

javascript - Javascript - 如何从文件输入控件中提取文件名

当用户在网页中选择文件时,我希望能够仅提取文件名。

我确实尝试了 str.search 功能,但是当文件名如下时它似乎失败了:c:\uploads\ilike.this.file.jpg

我们如何只提取没有扩展名的文件名?

0 投票
1 回答
3462 浏览

php - 提取 Zip 内的目录

我正在编写一个脚本,将 zip 存档中的文件提取到脚本所在的目录中。

这是我的代码:

这工作正常,但有一个问题。拉链包含一个额外的层。(zip/directory/files) 像这个目录/文件一样提取,而不仅仅是文件。

有没有办法去除这个额外的层?

谢谢你的帮助!

乔尔·德雷珀

0 投票
1 回答
3801 浏览

c# - 从 mht 中提取文本

我有一个 mht 文件,我希望得到 mht 的所有文本。我坚持使用正则表达式,但我在 mht 中除了英语还有其他语言,所以文本本身包含 A7=A98=D6 之类的东西...

选择在浏览器中查看的文件的所有文本,然后将其复制并粘贴到记事本中 - 这就是我需要的。

谢谢。

0 投票
3 回答
26980 浏览

matlab - MATLAB:在不使用循环的情况下提取矩阵的多个部分

我有一个巨大的二维矩阵,我想从中提取 15 个不同的 100x100 部分。我有两个向量 x 和 y ,其中保存了零件的左上角索引。我用过这样的东西:

但结果只是一个 100x100 矩阵而不是 15x100x100。为什么?

我知道它可以很容易地使用循环来完成,但我们不允许使用循环(这是图像处理练习的一部分)。另一种可能性是编写所有 15 行,但这有点难看。

你有什么优雅的解决方案吗?谢谢。

0 投票
3 回答
3492 浏览

python - 如何从 HTML 中提取嵌套表?

我有一个 HTML 文件(以 utf-8 编码)。我用codecs.open(). 文件架构是:

我只需要检索第一个表(丢弃带有表单的表)。省略<table>对应的 first 之前和之后的所有输入</table>。一些单元格还包含段落、粗体和脚本。主表的每一行不超过一个嵌套表。

如何提取它以获取行列表,其中每个元素包含普通(unicode 字符串)单元格的数据和每个嵌套表的行列表?嵌套层数不超过 1 层。

我尝试了 HTMLParse、PyParse 和 re 模块,但无法正常工作。我对 Python 很陌生。

0 投票
1 回答
2123 浏览

wpf - (WPF) 如何从多帧图像中提取帧 (tif, gif)

我正在尝试提取动画 gif 中每一帧的缩略图。下面的代码是我很想做的事情,但是 BitmapFrame 实例的 thumbnail 属性始终为空。

难道我做错了什么?

0 投票
9 回答
13167 浏览

php - 如何从提供的电子邮件地址创建用户名 - PHP

我的网站上有一个注册页面,用户只需提供电子邮件地址和密码即可。

我希望能够使用提供的电子邮件的第一部分自动为该用户创建用户名;

用户提供gordon @yourdomain.com,我想将用户名设为“gordon”

我不需要解释如何创建表单或将数据提交到数据库,只需要从提供的电子邮件中提取数据的代码,如果有必要,如果出现重复,请在末尾添加数字。

希望这是有道理的,似乎是一个基本功能,但在网上的任何地方都找不到它的例子!