问题标签 [extraction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何在 Linux 下将 EDB(ms 交换存储文件)提取到 PST?(最好在 Python 中)
我可以使用 libpst 从 PST 文件中提取和读取消息,但我也想从 edb 文件中提取消息(不是在线交换服务器,而是从离线文件中提取)。在 Linux 中。
任何 python lib 或任何类型的 linux 命令行工具都应该有所帮助。
谢谢。
delphi - 如何从资源中提取dll
我的应用程序使用 Bass.dll 并将其添加到资源中。我希望在应用程序启动它之前将其提取出来。如何作废呢?
php - Gmail 电子邮件地址提取器
我正在寻找一种方法来从我的 gmail 帐户中提取所有收件人的所有电子邮件地址...我从未使用过 Gmail API,因此欢迎任何开始的方向\
最好是php
xml - 是否有另一种方法可以从 Planet.osm 中提取数据转储?
我需要来自planet.osm 字段的数据转储,用于菲律宾的NCR 地区。我会将它用于 OpenStreetMap 项目。有没有一种方法可以在不下载整个文件的情况下提取planet.osm 的一小部分?我的意思是,planet.osm 文件大小为 11GB,我只需要它的一小部分。先感谢您!
php - 如何从字符串中提取单词并将它们插入数据库?标记
我想创建一个标记系统,所以我想知道如何提取散列词,即#tag,然后将它们插入数据库,你能带我去看看或帮忙吗!谢谢
pdf - 使用itext从pdf文件中提取日文字符
我正在尝试从包含日文字符的 pdf 文件中提取文本。我为此目的使用 iText 但是我得到了这个异常。
线程“主”ExceptionConverter 中的异常:com.itextpdf.text.DocumentException:无法识别带有“UniJIS-UCS2-H”的字体“KozMinPro-Regular”。
谁能帮我解决这个问题。
pdf - 如何从PDF中提取文本?
任何人都可以推荐一个库/API 来从 PDF 中提取文本和图像吗?我们需要能够获取文档预先知道的区域中包含的文本,因此 API 需要为我们提供页面上每个元素的位置信息。
我们希望以xml
或json
格式输出该数据。我们目前正在研究PdfTextStream,它看起来不错,但想听听其他人的经验和建议。
是否有替代方案(商业或免费)以编程方式从 pdf 中提取文本?
javascript - Readability 使用什么算法从 URL 中提取文本?
一段时间以来,我一直在尝试找到一种方法,通过消除与广告相关的文本和所有其他混乱,智能地从 URL 中提取“相关”文本。经过几个月的研究,我放弃了它作为一个问题那是无法准确确定的。(我尝试了不同的方法,但没有一个是可靠的)
一周前,我偶然发现了Readability——一个将任何 URL 转换为可读文本的插件。对我来说它看起来很准确。我的猜测是,他们不知何故有一个足够聪明的算法来提取相关文本。
有谁知道他们是怎么做到的?或者我怎么能可靠地做到这一点?
delphi - 如何在运行时将资源提取到文件中?
我只想分发一个 .exe,但是,在运行时我希望它能够将一些嵌入式图像资源提取到用户硬盘驱动器。
我可以吗?如果可以,怎么做?
java - 如何使 Java 程序不可提取
抱歉,我不太确定如何说明问题标题。我的问题是这样的,我开发了一个Java程序,我想把它分发给我的朋友。所以我将它导出到Jar文件,但我不希望他们提取jar文件来查看代码。无论如何要制作程序,以便没有人可以获取源代码,而只是启动程序。