问题标签 [watson-knowledge-studio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
47 浏览

watson-knowledge-studio - 如何以编程方式将文档上传到 IBM Knowledge Studio?

我目前每小时都会从一些网站生成最新消息。我找不到任何方法来上传文档以通过 API 进行注释。是否可以通过一些脚本来做到这一点?

0 投票
2 回答
140 浏览

nlp - 在 Watson Knowledge Studio 中为自定义实体类型创建 json 文件

我正在尝试为 WKS 实例上传一组自定义实体类型和子类型。

这是您可以定义实体和子实体的部分中的 WKS 界面视图。

这是您可以定义实体和子实体的部分中的 WKS 界面视图

上传按钮请求一个 json 文件。

我之前手动创建了一个集合,并下载了 json 文件。

它的第一行如下:

一般来说,内容结构是清晰的,但实体集和内容都有 ID。

不知道有没有办法提前知道,或者生成这些id,这样我就可以生成整个json,里面有我要使用的类型和子类型,然后上传。

我尝试使用“”代替 ID,但收到错误消息并且不允许上传。

0 投票
1 回答
147 浏览

nlp - 在 IBM-Watson Knowledge Studio 中下载 ML 注释

我正在使用 WKS 处理 NLP 应用程序,经过培训,得到了相当低的性能结果。

我想知道是否有一种方法可以下载带有实体分类的注释文档,包括训练集和测试集,这样我就可以自动详细识别关键差异在哪里,这样我就可以修复它们。

那些由人工注释的,可以在“资产”/“文档”-> 下载文档集(右侧的按钮)部分下载。

以下 Python 代码可让您查看其中的数据:

然后可以迭代读取压缩文件“gt”文件夹下的每一个JSON文件,得到详细的分句、分词和标注。

我需要的是能够通过 TEST 文档下载机器学习模型产生的注释,这些注释在“机器学习模型”/“性能”/“查看解码结果”中可见。

有了这个,我将能够识别可能导致修改类型字典和注释标准的特定偏差。

0 投票
1 回答
40 浏览

watson-knowledge-studio - WEX 的输出是否支持基于 WKS 上下文的实体类型角色?

如果我在 Watson Knowledge Studio 中准备一个机器学习模型,根据上下文使用具有角色的实体类型进行注释,这些具有角色的实体类型是否会出现在报告中并从 Watson Explorer (oneWEX) 导出输出?

0 投票
2 回答
98 浏览

ibm-watson - IBM Knowledge Studio - 高级规则工作区:无法导出高级规则模型 zip 文件

首先,我要向这个伟大的社区致以热烈的问候和感谢,你们无数次帮助我解决了各种各样的问题。

现在,回到问题部分......

我正在尝试保存一个包含我开发的模型的 zip 文件,以使用 IBM Knowledge Studio Advanced Rules Workspace,[完整文档],1将其部署在 NLU 上, 但是当我单击导出时,选择我开发的提取器

在此处输入图像描述

它无法保存 zip 文件,所以我无法继续

在此处输入图像描述

应用程序本身没有显示错误,但我看到“导出提取器”窗口中的“导出为”和“导出到”选项不可修改(屏幕截图中可见的值是唯一存在的值)。

然后,我通过控制台看到,当我在窗口中单击“确定”以导出 zip 文件时,网页出现错误:https ://i.imgur.com/8LehzYQ.png

它似乎无法读取“导出提取器”窗口中的某些 zip 复选框...

在此处输入图像描述

请帮助我,因为我完全被卡住了:(

0 投票
0 回答
10 浏览

watson-knowledge-studio - WKS 默认分词器会在任何有点的时候截断短语,这是缩写的问题

我在 WKS 中使用基于机器学习的分词器(默认)并遇到问题,因为只要结尾有一个点,短语就会被截断。问题是这也适用于缩写词..例如 Dr. John 或 $。2000 或文档。每当 Watson 找到点时,4334554 就会被截断成不同的行……关于如何克服这个问题的任何提示?