问题标签 [retrieve-and-rank]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
318 浏览

ibm-cloud - ibm watson 检索和排名服务设置中的 train.py 错误

我正在关注检索和排名教程,在 train.py 脚本之前一切都很好 - 我收到错误“ ValueError: No JSON object could be decoded

我的命令行蒙面信用:

结果:

想法为什么我会收到这个错误,最重要的是如何解决它?

谢谢,尼克

0 投票
2 回答
330 浏览

ibm-watson - NLC 或 R&R 的再训练方法

我们知道的基本事实用于重新训练 NLC 或 R&R。

基本事实是问题级别的训练数据。

例如

“今天有多热?,温度”

问题“今天有多热?” 因此被归类为“温度”类。

应用程序启动后,将收到真实的用户问题。有些是相同的(即来自真实用户的问题与基本事实中的问题相同),有些是相似的术语,有些是新问题。假设应用程序有一个反馈循环来了解类(对于 NLC)或答案(对于 R&R)是否相关。

简而言之,这里的主要问题是关于 NLC 和 R&R 的再培训方法是什么……

0 投票
1 回答
224 浏览

python - IBM Waston - 检索和排名

我正在关注检索和排名教程,在 train.py 脚本之前一切都很好 - 我在下面收到一条错误消息:

有任何想法吗?

0 投票
2 回答
265 浏览

json - Watson API - 检索和排名 - 上传 JSON 时出错

我正在学习Retrieve and Rank - Get Started中的教程,并且我正在执行以下步骤:

发出以下命令将 cranfield_data.json 数据上传到 example_collection 集合。将 {username}、{password}、{solr_cluster_id} 和 {/path_to_file} 替换为您的信息:

我正在使用正确的用户名和密码以及正确的 cluster_id 和 json 路径发送请求,但出现以下错误:

0 投票
1 回答
127 浏览

ibm-watson - 如何解释 IBM Retrieve&Rank 结果中的 featureVector 和 score?

fcselect 结果中有以下字段,对于每个结果,'score,featureVector'。Score max value is 10, while featureVector can be "1.8894386 0.94715786 0.39159727 0.96143353 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.13101925 0.01616435 0.0 0.01616435 1.5496718 0.7325779 0.27778885 0.7465826 0.75 0 0.6931471805599453 10.0"

分数=10 是什么意思?10 是最大匹配吗?featureVector 对我的结果意味着什么?

0 投票
1 回答
377 浏览

ibm-watson - Watson 检索和排名方法排名 VS 搜索和排名

在 Retrieve&Rank 服务文档中,有 2 种关于结果排名的方法

有什么区别?排名方法中的“自定义功能”是什么意思?我什么时候需要使用第一种方法?什么时候使用第二种方法?

0 投票
1 回答
94 浏览

solr - 在 Watson 检索和排名服务的 Solr 集群中创建自动生成的长字段(标识符/唯一键)

我想在 Solr 集群中自动生成 Long 唯一键。我正在使用 IBM Watson Retrieve and Rank 服务,并尝试了 Solr 的标准方法来自动生成机制(生成 UUID 等),但它不适用于 Retrieve 和 Rank 集群。也许 IBM 使用的是旧版本的 Solr 或者它是 IBM 定制的。

谁有这样的情况,他/她是如何解决的?

那你提前。

0 投票
0 回答
74 浏览

solr - 在 Retrieve and rank 如何告诉服务这些词是相同的上下文

例如,我想查询“告诉我发烧症状”,但它打破了“发烧”和“症状”,最终给出了一些错误的结果。

在 Apache solr 中,我们可以使用双引号进行查询,但在 RnR 中它没有任何区别。

有时甚至会返回带有错误结果的基本事实查询。

假设“发烧的症状是什么”是我的查询,那么 solr 索引“what”、“are”、“the”、“symptoms”、“of”、“fever”。将什么,为什么,如何等添加到停用词是一种好习惯,因为这样做会改变查询的含义。

请帮助我。

0 投票
1 回答
119 浏览

ibm-watson - IBM Watson Retrieve&Rank 中的自定义 UIMA 注释器

是否可以在 Retrieve&Rank 服务中使用自定义 uima 注释器?
如何将我的自定义注释器(打包为 jar 文件)上传到服务?

我需要创建一个实体注释器来发现我的自定义域实体。

0 投票
2 回答
197 浏览

json - 在“Bluemix”solr 中索引 nutch 爬网数据

我正在尝试通过 Bluemix solr 索引 nutch 抓取的数据,但无论如何我都找不到这样做。我的主要问题是:有没有人可以帮助我这样做?我应该怎么做才能将我的 nutch 抓取数据的结果发送到我的 Blumix Solr。对于爬行,我使用了 nutch 1.11,这是我现在所做的一部分以及我面临的问题:我认为可能有两种可能的解决方案:

  1. 通过 nutch 命令:

“NUTCH_PATH/bin/nutch index crawl/crawldb -linkdb crawl/linkdb crawl/ -Dsolr.server.url="OURSOLRURL"”</p>

我可以通过OURSOLR索引nutch爬取的数据。但是,我发现了一些问题。

a-虽然听起来很奇怪,但它无法接受 URL。我可以改用 URL 的编码来处理它。

b-由于我必须连接到特定的用户名和密码,nutch 无法连接到我的 solr。考虑到这一点:

在命令行输出中,我尝试通过使用命令“solr.auth=true solr.auth.username="SOLR-UserName" solr.auth.password="Pass" 的身份验证参数来管理这个问题。

所以到目前为止,我必须使用这个命令:

”bin/nutch index crawl/crawldb -linkdb crawl/linkdb crawl/segments/2016* solr.server.url="https%3A%2F%2Fgateway.watsonplatform.net%2Fretrieve-and-rank%2Fapi%2Fv1%2Fsolr_clusters% 2FCLUSTER-ID%2Fsolr%2Fadmin%2Fcollections" solr.auth=true solr.auth.username="USERNAME" solr.auth.password="PASS"“。

但是由于某种我还没有意识到的原因,该命令将身份验证参数视为已抓取的数据目录并且不起作用。所以我想这不是“Active IndexWriters”的正确方法,谁能告诉我那我该怎么办?

  1. 通过 curl 命令:

“curl -X POST -H "Content-Type: application/json" -u "BLUEMIXSOLR-USERNAME":"BLUEMIXSOLR-PASS" " https://gateway.watsonplatform.net/retrieve-and-rank/api/v1/ solr_clusters/CLUSTERS-ID/solr/example_collection/update " --data-binary @{/path_to_file}/FILE.json"</p>

我想也许我可以提供这个命令创建的 json 文件:

bin/nutch commoncrawldump -outputDir finalcrawlResult/ -segment crawl/segments -gzip -extension json -SimpleDateFormat -epochFilename -jsonArray -reverseKey 但是这里有一些问题。

一个。此命令在复杂的路径中提供了如此多的文件,这将花费大量时间来手动发布所有这些文件。我猜对于大的 cawling 来说这甚至是不可能的。有没有办法通过一个命令一次发布目录及其子目录中的所有文件?

湾。在 commoncrawldump 创建的 json 文件的开头有一个奇怪的名称“ÙÙ÷yœ”。

C。我删除了奇怪的名称并尝试仅发布其中一个文件,但结果如下:

这是否意味着这些文件不能提供给 Bluemix solr 并且对我来说毫无用处?