问题标签 [extractor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2582 浏览

java - Java Metadata Extractor causes java.lang.NoClassDefFoundError

I'm trying to use this library for Images Metadata Extraction in Java https://github.com/drewnoakes/metadata-extractor , using NetBeans.

I imported the file metadata-extractor-2.7.0.jar into the jar folder of the project, and like the readme says, I simply do:

but I always get

There is something I need to configure in Netbeans before I start using this library?

0 投票
1 回答
4983 浏览

json - 如何使用 JSON 路径提取器中提取的变量进行场景的进一步步骤?

我在 Jmeter 中创建了一个我正在登录的场景。(对于这个场景,我使用的是 REST API)为此,我使用了一个“HTTP Header Manager”,“HTTP Request Sampler”。

登录后,我正在提取自动生成的身份验证令牌。使用此身份验证令牌,我正在尝试在应用程序中添加一些值。为此我使用了:1)jp@gc - JSON 路径提取器 2)调试采样器

在执行时,我可以在“查看结果树”列表器中看到身份验证令牌捕获。

但是添加用户(第二个 HTTP 请求采样器)步骤失败并显示错误“未经授权。

您能否告诉我如何在“添加用户”步骤中使用该身份验证令牌,以便我可以更新 Web 应用程序。

0 投票
1 回答
1274 浏览

html - 如何使用 Apache tika 解析器从 HTML 中提取标题、正文和图像

我想从 HTML 页面中提取标题、html 正文(纯文本)、图像 url,是否可以使用 Apache Tika 服务器来实现它?

0 投票
1 回答
110 浏览

scalability - 如何在 JSVM 中生成 AVC 比特流的跟踪文件?

我被这个问题困扰了大约一个月。

我想在 JSVM 中生成 AVC 比特流的跟踪文件。它总是显示:“未找到可扩展性 SEI 消息!提取器退出。”

请帮助我。

埃尔文

0 投票
1 回答
3095 浏览

jmeter - 如何提取 JDBC 请求响应?

我的 JDBC 请求响应如下,

如何从响应中仅提取“请求令牌”?

0 投票
2 回答
975 浏览

java - 连续对象值提取器的设计模式

考虑一个在“拉”的基础上从源中提取对象值的对象,直到null遇到一个特殊值(例如, )。

Java中,API 可能类似于

从操作上讲,这是一个,Iterator但它只有一个(某种)“next()”方法,而不是一个Reader,因为它不会逐字节地从源中读取。它也类似于数据库游标,因为它“滚动”所有数据值(记录),直到它们用尽。

这个用例除了“迭代器”之外还有其他设计模式吗?

调用这样一个简单对象的最佳名称是什么?

0 投票
1 回答
150 浏览

java - 电子邮件提取器 Java 模式不包括点前的字符

我目前正在使用运行良好的电子邮件提取器,但我想更改其模式:

这种模式的问题在于它排除了点之前的所有字符。

例如,如果它找到像" john.smith@gmail.com" 这样的电子邮件,它将报告"smith@gmail.com"

我不知道我应该在模式中写什么,所以它不再排除点之前的字符。

如果有人有想法,请告诉我......非常感谢!

0 投票
1 回答
186 浏览

python - 如何解决递归深度超出(Goose-extractor)

我是 goose-extractor 的一个问题这是我的代码:

看看我的问题。

有什么建议么 ?

我是一个糟糕的程序员或隐藏的错误在 python 中不可见

0 投票
1 回答
94 浏览

web-crawler - scrapy中的SgmlLinkExtractor

我需要一些关于scrapy中SgmlLinkExtractor的启示。

对于链接:example.com/YYYY/MM/DD/title我会写:

对于链接:example.com/news/economic/title我应该写:

r'\news\category\w+'还是r'\news\w+/\w+'?(类别更改但网址始终包含新闻

对于链接:example.com/article/title我应该写:

r'\article\w+'? (网址始终包含文章

0 投票
1 回答
607 浏览

scala - Scala 的头/尾提取器的时间和空间复杂度是多少?

这个的时间和空间复杂度是多少:

是否取决于实施Seq?既然IndexedSeq应该有O(1)tail vs O(n)for LinearSeqs?空间复杂度是O(n)因为递归调用堆栈还是 Scala 自动进行尾调用优化?