问题标签 [extract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
asp.net - 使用 ASP.NET/C# 读取 Word 2007 文件并提取文本、评论和评论者姓名
我有一个允许 Word 2007 文档上传的 ASP.NET 应用程序。上传后,我想解析文档文本以及审阅者的任何评论。我希望能够获得评论和评论者首字母/姓名。
有免费的库可以做到这一点吗?我不喜欢自动化 Word,因为这个过程需要有一定的可扩展性。
python - 仅从 Jython 中的数据中提取数字
这是我的问题。我正在开发一个 Jython 程序,我必须从 PyJavaInstance 中提取数字:
[{string1="foo", xxx1, xxx2, ..., xxxN, string2="bar"}]
(其中 xxx 是浮点数)。
我的问题是如何提取数字并将它们放入更简单的结构中,例如 python 列表。
先感谢您。
regex - 使用 RegEx 提取部分文本
我想使用正则表达式提取文本的一部分。例如,我有一个地址,想只返回数字和街道并排除其余的:
但是大多数时候地址的格式会有所不同。我尝试使用 Lookbehind Regex 并得出了这个表达式:
上面的表达式很好地处理了上面的例子,但是一旦逗号进入文本,邮政编码可以是一个 6 个字符的字符串或两个 3 个字符的字符串,中间有一个空格等等,它就会变得太混乱......
除了后向正则表达式之外,还有什么更优雅的方式来提取部分文本?
非常感谢任何建议或另一个方向的观点。
谢谢!
php - 在 PHP 中删除从第一次出现的字符到字符串结尾的所有内容
我想从 PHP 中字符串的第一个逗号中删除所有内容(包括逗号)。
例如,
应该成为
perl - 如何在 Perl 中从 PDF 文件中提取文本?
我正在尝试使用 Perl 从 PDF 文件中提取文本。我一直在使用pdftotext.exe
命令行(即使用 Perlsystem
函数)从 PDF 文件中提取文本,这种方法效果很好。
问题是我们在 PDF 文件中有像 α、β 和其他特殊字符这样的符号,这些符号没有显示在生成的 txt 文件中。文本中也随机添加了一些额外的空格。
是否有更好、更可靠的方法从 PDF 文件中提取文本,使文本包含所有符号,如 α、β 等,并且文本与 PDF 中的文本完全匹配(即没有多余的空格)?
php - PHP - extract() 类型
PHP 的extract()
功能可以是几个之一extract_types
。extr_prefix_same
但是和有什么区别extr_prefix_if_exists
?该手册听起来像是在任何一种情况下,如果变量名称已经存在,则新变量将作为前缀。
谢谢!
r - 括号 [ ] 和双括号 [[ ]] 用于访问列表或数据框元素的区别
R 提供了两种不同的方法来访问列表或 data.frame 的元素:[]
和[[]]
。
两者有什么区别,什么时候应该使用其中一个?
php - 在 XML 中使用 php 特定参数查找
你好我有以下问题。
我有一个 XML 文件,我知道“uniquename=value2”的值。我想提取 URL 的值。
有人有建议吗?
谢谢大家。
php - 将字符串分成几部分
我在表格中有一个问题列表,其中一些问题只有在满足某些条件时才会显示。一条记录可能具有像 4002=Y 这样简单的标准,其中 4002 是问题编号,Y 是答案。如果 4002=Y 则显示问题。
对于只有一个标准的记录,我没有问题。
但是有些记录的标准如下:
在这种情况下,我需要评估每个选项以查看是否要显示问题。
其他问题将有类似的字符串;有的更短,有的更长。
我如何最好地将字符串拆分,以便我可以一次评估每个部分并且仍然能够正确比较它们?
我可以在某种程度上重新格式化数据,但如果可能的话,我宁愿不这样做。
这是一项regex()
任务(我还不是很熟悉)?我试过了list()
,split()
但explode()
收效甚微。
任何指针将不胜感激。
perl - 如何在 Perl 中提取两个行分隔符之间的行?
我有一个 ASCII 日志文件,其中包含一些我想提取的内容。我从来没有花时间正确学习 Perl,但我认为这是完成这项任务的好工具。
该文件的结构如下:
所以,我正在寻找一种方法来提取每个字符串START
和END
分隔符字符串之间的行。我怎样才能做到这一点?
到目前为止,我只找到了一些关于如何用START
字符串打印一行的示例,或者与我正在寻找的内容有些相关的其他文档项目。