问题标签 [extractor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1208 浏览

scala - Scala extractors - skip unused parameters

given following code:

When using generated extractor, is it possible to skip remaining parameters, supposing they're unused ?

e.g. I don't want to write plenty of underscores in the following code snippet:

0 投票
2 回答
1593 浏览

java - Scala 编译器不使用 case 类的 unapply 方法进行模式匹配,这是为什么呢?

假设我已经定义了 Cat 和 Dog,两个案例类。

然后我像这样使用它们:

如果我将字节码反编译为 Java,我会得到如下信息:

编译器为 Cat 和 Dog 生成 unapply 方法,但它们不用于模式匹配代码。

这是为什么?

0 投票
1 回答
695 浏览

java - 如何删除word文档中的超链接和图片?

我曾尝试使用删除 Word 文档中的超链接和图像Apache POI
这是我的代码

但无法获得清晰的文本。

0 投票
1 回答
1039 浏览

regex - JMETER:用运行时生成的新值替换硬编码的请求参数?

在我正在测试的网络应用程序中,在运行时生成一个唯一的授权代码,并在该 [网络浏览器] 会话期间与每个 http 请求一起提交。Jmeter 脚本记录器存储硬编码值,该值再次仅在该会话期间有效。

我可以使用正则表达式提取器来捕获授权代码,该代码是在测试计划中的第 10 个 http 请求上生成的。我需要告诉 JMETER 在测试中的所有后续 http 请求中使用这个新的授权代码。我可以用提取的新值手动替换所有后续出现的代码,但这意味着需要进行数百次手动更改。

有什么方法可以告诉 JMETER 从给定点开始,忽略硬编码值并使用第 10 次调用期间提取的值。这很重要,因为每个测试计划都有数百个调用,并且网站会有多个测试计划。

谢谢

0 投票
2 回答
1869 浏览

scala - 如何匹配多个案例类并提取相同的(命名)参数?

考虑以下在实数表达式上实现一元和二元运算的人为示例。

现在,我想做类似的事情:

有时我什至还想引用匹配的类型;例如

我尝试过的一些失败的尝试:

  • abstract case class DoubleEBinary(a: DoubleE, b: DoubleE)+ 从那里扩展,但这是不允许的:错误:...禁止逐个继承。为了克服这个限制,使用提取器在非叶节点上进行模式匹配
  • 上面的错误提示:

    这也不起作用:错误:未找到:值 DoubleEBinary

  • 尝试使用案例别名
    • case binOp @ (Mult(a, b) | Div(a, b) | ...) => ...
    • case binOp(a, b) @ (Mult(_, _) | Div(_, _) | ...) => ...
    • case (binOp @ Mult(a, b)) | (binOp @ Div(a, b)) => ...

我没有尝试过的一件事是使用嵌套函数重载,这似乎有点矫枉过正......

在与上述类似的场景中,是否有匹配多个案例类的好方法?

注意:在继承中添加额外的方法、类、特征是可以的。

0 投票
1 回答
786 浏览

html - 如何使用 Jmeter 从 Div 标签中获取或提取值

我想从 Div 标签中获取 OTP 值(123456),因为它每次都在变化。
我如何在 Jmeter 中做到这一点?我有一些想法,它可以通过xpath 提取器和调节器表达式来完成..但在 dong 中没有成功所以..请帮助我。代码示例是这样的。

0 投票
1 回答
711 浏览

regex - 如何在 JMeter 中使用正则表达式提取器在循环中填充请求

我有一个简单的测试计划:

问题是何时执行第一个循环。SOAP 请求填充了正则表达式提取器中的变量名称,而不是值。谁能告诉我如何解决这个问题?

[编辑] 测试计划画面

正如您在第一张图片上看到的那样,它显示了 jdbc 响应数据。第一个位置是值'22;1'。第二个显示第一个soap请求失败不是值而是变量名...第三个显示第二个请求正确填写

http://postimg.org/image/owl5kue4v/

下面是我为每个循环添加调试采样器时的屏幕。在这种情况下,第一个 SOAP 请求被正确填充。

http://postimg.org/image/aad3c0ngt/

我的问题是如何在不添加调试采样器的情况下获得与第二种情况相同的行为?

顺便说一句,对不起,外部服务器上的图像,但我的等级太低,无法在此处添加它们

0 投票
1 回答
1223 浏览

pdf - 使用 Apache Nutch - 提取器插件解析 PDF 问题

我正在尝试从网站索引网页和 pdf 文档。我正在使用 Nutch 1.9。

我从https://github.com/BayanGroup/nutch-custom-search下载了 nutch-custom-search 插件。该插件很棒,确实让我将选定的 div 与 solr fieds 匹配。

我遇到的问题是,我的网站还包含许多 pdf 文件。我可以看到它们被提取但从未被解析。我查询 solr 时没有 pdf。只是网页。我正在尝试使用 tika 来解析 .PDF(我希望我有正确的想法)

如果在 cygwin 上,我运行 parsechecker,如下所示,它似乎解析 OK:

我不太确定下一步该做什么(请参阅下面的配置)

提取器.xml

在我的 parse-plugins.xml 里面我添加了

nutch-site.xml

帮助将不胜感激,

谢谢

克里斯

0 投票
1 回答
85 浏览

solr - 如何使用提取器插件中的 css 引擎访问内部 html 内容以进行过滤过程

我已经为 Apache Nutch 和 Solr 配置了用于过滤 html 内容的提取器插件。我如何能够使用 css 引擎或 xpath 引擎访问内部 div 内容。提前致谢。

0 投票
2 回答
123 浏览

scala - Why doesn't Scala optimize calls to the same Extractor?

Take the following example, why is the extractor called multiple times as opposed to temporarily storing the results of the first call and matching against that. Wouldn't it be reasonable to assume that results from unapply would not change given the same string.