1

我使用 IBM Watson Retrieve and Rank Web Interface 创建了一组 html 文章。通过网络界面,我能够上传我的 html 文章。问题是当我查询集合时,id 和 title 的数据不可用。这是我在浏览器中进行的查询:

https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=什么是基本跨音速副翼嗡嗡声的机制&wt=json&fl=id,title

我得到的回应是:

{"responseHeader":{"status":0,"QTime":106,"params":{"q":"跨音速副翼嗡嗡声的基本机制是什么","fl":"id,title", "wt":"json"}},"response":{"numFound":12,"start":0,"docs":[{ "id":"6a06f47c-cb3f-4791-9914-c84772eb9415","标题“:”无标题“ }.....

粗体部分是问题所在。使用网页界面时,有没有办法在上传文件时设置标题和ID?或者,更好的是,是否有另一种方法可以查询我的收藏以获取我上传的文档的文件名和/或文档中的文本?

4

1 回答 1

2

使用网页界面时,有没有办法在上传文件时设置标题和ID?

不,对不起。

但是,如果您从 Web 界面外部自行上传文档,则可以指定标题和 ID(当您返回 Web 界面时,文档将显示在 Web 界面中)。

是否有另一种方法可以查询我的收藏以获取我上传的文档的文件名

是的

在您上面发布的查询中,您拥有的最后一个参数是您要检索的字段

&fl=id,title

您正在检索 ID 和标题。

如果您想要内容来自的文件的名称,请添加fileName. 例如:

https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=什么是基本跨音速副翼嗡嗡声的机制&wt=json&fl=id,title,fileName

是否有另一种方法可以查询我的收藏以从文档中获取文本

是的。

与上面类似,您只需要更新您检索的字段列表。文档的内容放在一个名为body.

因此,要获取 ID、标题和正文,您可以使用:

https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=什么是基本跨音速副翼嗡嗡声的机制&wt=json&fl=id,title,body

这将为您提供内容的纯文本版本。如果您想要 HTML,请contentHtml改用。

https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=什么是基本跨音速副翼嗡嗡声的机制&wt=json&fl=id,title,contentHtml

于 2016-12-09T12:16:51.830 回答