我正在使用 IBM Watson 的 Discovery 服务。我想使用此服务构建一个搜索引擎,并使用 Java API 将文件上传到我将在其中进行搜索的集合。
我想知道是否可以在服务上应用低级定制,例如内容提取、术语标记化、在处理内容期间应用的任何过滤器。我搜索了 Java API 文档,似乎不可能,但我想确定一下。
谢谢你。
我正在使用 IBM Watson 的 Discovery 服务。我想使用此服务构建一个搜索引擎,并使用 Java API 将文件上传到我将在其中进行搜索的集合。
我想知道是否可以在服务上应用低级定制,例如内容提取、术语标记化、在处理内容期间应用的任何过滤器。我搜索了 Java API 文档,似乎不可能,但我想确定一下。
谢谢你。
请参考本文档进行定制。 https://console.bluemix.net/docs/services/discovery/building.html#configuring-your-service
标记化取决于您指定的语言,但没有提供任何自定义。
数据爬虫确实提供了一定程度的 url 过滤,但不确定这是否是您要查找的内容。https://console.bluemix.net/docs/services/discovery/data-crawler.html#adding-content-with-data-crawler