问题标签 [extract]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

5287 问题

0 投票

2 回答

1169 浏览

asp.net - 使用 ASP.NET/C# 读取 Word 2007 文件并提取文本、评论和评论者姓名

我有一个允许 Word 2007 文档上传的 ASP.NET 应用程序。上传后，我想解析文档文本以及审阅者的任何评论。我希望能够获得评论和评论者首字母/姓名。

有免费的库可以做到这一点吗？我不喜欢自动化 Word，因为这个过程需要有一定的可扩展性。

asp.net ms-word comments extract word-2007

2009-07-07T16:40:51.373

0 投票

3 回答

232 浏览

python - 仅从 Jython 中的数据中提取数字

这是我的问题。我正在开发一个 Jython 程序，我必须从 PyJavaInstance 中提取数字：

[{string1="foo", xxx1, xxx2, ..., xxxN, string2="bar"}]

（其中 xxx 是浮点数）。

我的问题是如何提取数字并将它们放入更简单的结构中，例如 python 列表。

先感谢您。

python list jython extract

2009-07-08T14:56:48.320

0 投票

3 回答

780 浏览

regex - 使用 RegEx 提取部分文本

我想使用正则表达式提取文本的一部分。例如，我有一个地址，想只返回数字和街道并排除其余的：

但是大多数时候地址的格式会有所不同。我尝试使用 Lookbehind Regex 并得出了这个表达式：

上面的表达式很好地处理了上面的例子，但是一旦逗号进入文本，邮政编码可以是一个 6 个字符的字符串或两个 3 个字符的字符串，中间有一个空格等等，它就会变得太混乱......

除了后向正则表达式之外，还有什么更优雅的方式来提取部分文本？

非常感谢任何建议或另一个方向的观点。

谢谢！

regex extract lookbehind

2009-07-09T23:34:48.213

0 投票

6 回答

26731 浏览

php - 在 PHP 中删除从第一次出现的字符到字符串结尾的所有内容

我想从 PHP 中字符串的第一个逗号中删除所有内容（包括逗号）。

例如，

应该成为

php replace substring extract

2009-07-15T13:27:42.310

0 投票

8 回答

41503 浏览

perl - 如何在 Perl 中从 PDF 文件中提取文本？

我正在尝试使用 Perl 从 PDF 文件中提取文本。我一直在使用pdftotext.exe命令行（即使用 Perlsystem函数）从 PDF 文件中提取文本，这种方法效果很好。

问题是我们在 PDF 文件中有像 α、β 和其他特殊字符这样的符号，这些符号没有显示在生成的 txt 文件中。文本中也随机添加了一些额外的空格。

是否有更好、更可靠的方法从 PDF 文件中提取文本，使文本包含所有符号，如 α、β 等，并且文本与 PDF 中的文本完全匹配（即没有多余的空格）？

perl pdf text extract

2009-07-16T11:39:13.950

0 投票

3 回答

908 浏览

php - PHP - extract() 类型

PHP 的extract()功能可以是几个之一extract_types。extr_prefix_same但是和有什么区别extr_prefix_if_exists？该手册听起来像是在任何一种情况下，如果变量名称已经存在，则新变量将作为前缀。

谢谢！

php extract exists prefix

2009-07-20T02:58:26.003

0 投票

12 回答

285755 浏览

r - 括号 [ ] 和双括号 [[ ]] 用于访问列表或数据框元素的区别

R 提供了两种不同的方法来访问列表或 data.frame 的元素：[]和[[]]。

两者有什么区别，什么时候应该使用其中一个？

r list dataframe extract r-faq

2009-07-23T03:33:18.410

0 投票

1 回答

189 浏览

php - 在 XML 中使用 php 特定参数查找

你好我有以下问题。

我有一个 XML 文件，我知道“uniquename=value2”的值。我想提取 URL 的值。

有人有建议吗？

谢谢大家。

php xml parsing extract

2009-07-26T18:27:29.393

0 投票

5 回答

259 浏览

php - 将字符串分成几部分

我在表格中有一个问题列表，其中一些问题只有在满足某些条件时才会显示。一条记录可能具有像 4002=Y 这样简单的标准，其中 4002 是问题编号，Y 是答案。如果 4002=Y 则显示问题。

对于只有一个标准的记录，我没有问题。

但是有些记录的标准如下：

在这种情况下，我需要评估每个选项以查看是否要显示问题。

其他问题将有类似的字符串；有的更短，有的更长。

我如何最好地将字符串拆分，以便我可以一次评估每个部分并且仍然能够正确比较它们？

我可以在某种程度上重新格式化数据，但如果可能的话，我宁愿不这样做。

这是一项regex()任务（我还不是很熟悉）？我试过了list()，split()但explode()收效甚微。

任何指针将不胜感激。

php string extract

2009-07-27T02:19:49.103

0 投票

6 回答

36479 浏览

perl - 如何在 Perl 中提取两个行分隔符之间的行？

我有一个 ASCII 日志文件，其中包含一些我想提取的内容。我从来没有花时间正确学习 Perl，但我认为这是完成这项任务的好工具。

该文件的结构如下：

所以，我正在寻找一种方法来提取每个字符串START和END分隔符字符串之间的行。我怎样才能做到这一点？

到目前为止，我只找到了一些关于如何用START字符串打印一行的示例，或者与我正在寻找的内容有些相关的其他文档项目。

perl string extract delimiter

2009-07-31T14:19:36.670

1 2 3 4 5 6 7 8 9 10