问题标签 [extract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1169 浏览

asp.net - 使用 ASP.NET/C# 读取 Word 2007 文件并提取文本、评论和评论者姓名

我有一个允许 Word 2007 文档上传的 ASP.NET 应用程序。上传后,我想解析文档文本以及审阅者的任何评论。我希望能够获得评论和评论者首字母/姓名。

有免费的库可以做到这一点吗?我不喜欢自动化 Word,因为这个过程需要有一定的可扩展性。

0 投票
3 回答
232 浏览

python - 仅从 Jython 中的数据中提取数字

这是我的问题。我正在开发一个 Jython 程序,我必须从 PyJavaInstance 中提取数字:

[{string1="foo", xxx1, xxx2, ..., xxxN, string2="bar"}]

(其中 xxx 是浮点数)。

我的问题是如何提取数字并将它们放入更简单的结构中,例如 python 列表。

先感谢您。

0 投票
3 回答
780 浏览

regex - 使用 RegEx 提取部分文本

我想使用正则表达式提取文本的一部分。例如,我有一个地址,想只返回数字和街道并排除其余的:

但是大多数时候地址的格式会有所不同。我尝试使用 Lookbehind Regex 并得出了这个表达式:

上面的表达式很好地处理了上面的例子,但是一旦逗号进入文本,邮政编码可以是一个 6 个字符的字符串或两个 3 个字符的字符串,中间有一个空格等等,它就会变得太混乱......

除了后向正则表达式之外,还有什么更优雅的方式来提取部分文本?

非常感谢任何建议或另一个方向的观点。

谢谢!

0 投票
6 回答
26731 浏览

php - 在 PHP 中删除从第一次出现的字符到字符串结尾的所有内容

我想从 PHP 中字符串的第一个逗号中删除所有内容(包括逗号)。

例如,

应该成为

0 投票
8 回答
41503 浏览

perl - 如何在 Perl 中从 PDF 文件中提取文本?

我正在尝试使用 Perl 从 PDF 文件中提取文本。我一直在使用pdftotext.exe命令行(即使用 Perlsystem函数)从 PDF 文件中提取文本,这种方法效果很好。

问题是我们在 PDF 文件中有像 α、β 和其他特殊字符这样的符号,这些符号没有显示在生成的 txt 文件中。文本中也随机添加了一些额外的空格。

是否有更好、更可靠的方法从 PDF 文件中提取文本,使文本包含所有符号,如 α、β 等,并且文本与 PDF 中的文本完全匹配(即没有多余的空格)?

0 投票
3 回答
908 浏览

php - PHP - extract() 类型

PHP 的extract()功能可以是几个之一extract_typesextr_prefix_same但是和有什么区别extr_prefix_if_exists?该手册听起来像是在任何一种情况下,如果变量名称已经存在,则新变量将作为前缀。

谢谢!

0 投票
12 回答
285755 浏览

r - 括号 [ ] 和双括号 [[ ]] 用于访问列表或数据框元素的区别

R 提供了两种不同的方法来访问列表或 data.frame 的元素:[][[]]

两者有什么区别,什么时候应该使用其中一个?

0 投票
1 回答
189 浏览

php - 在 XML 中使用 php 特定参数查找

你好我有以下问题。

我有一个 XML 文件,我知道“uniquename=value2”的值。我想提取 URL 的值。

有人有建议吗?

谢谢大家。

0 投票
5 回答
259 浏览

php - 将字符串分成几部分

我在表格中有一个问题列表,其中一些问题只有在满足某些条件时才会显示。一条记录可能具有像 4002=Y 这样简单的标准,其中 4002 是问题编号,Y 是答案。如果 4002=Y 则显示问题。

对于只有一个标准的记录,我没有问题。

但是有些记录的标准如下:

在这种情况下,我需要评估每个选项以查看是否要显示问题。

其他问题将有类似的字符串;有的更短,有的更长。

我如何最好地将字符串拆分,以便我可以一次评估每个部分并且仍然能够正确比较它们?

我可以在某种程度上重新格式化数据,但如果可能的话,我宁愿不这样做。

这是一项regex()任务(我还不是很熟悉)?我试过了list()split()explode()收效甚微。

任何指针将不胜感激。

0 投票
6 回答
36479 浏览

perl - 如何在 Perl 中提取两个行分隔符之间的行?

我有一个 ASCII 日志文件,其中包含一些我想提取的内容。我从来没有花时间正确学习 Perl,但我认为这是完成这项任务的好工具。

该文件的结构如下:

所以,我正在寻找一种方法来提取每个字符串STARTEND分隔符字符串之间的行。我怎样才能做到这一点?

到目前为止,我只找到了一些关于如何用START字符串打印一行的示例,或者与我正在寻找的内容有些相关的其他文档项目。