问题标签 [watson-knowledge-studio]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
watson-discovery - 使用 Watson Knowledge Studio 和 Watson Discovery 进行文本挖掘
您能否告诉我如何使用 Watson Knowledge Studio 和 Watson Discovery 提取具有指定单位的值。该想法基于报告“近期认知神经科学和心理学文献中已发表效果大小和力量的实证评估”中描述的使用 Matplot 的方法。
watson-knowledge-studio - 如何在 Watson Knowledge Studio 中停用句子边界检测?
我使用 Watson Knowledge Studio 来分析简历。当我上传文档时,Watson 会运行句子边界检测。但是,简历与电子邮件或评论等自然语言并不完全一样,并且标点符号较少。因此,句子边界检测可能会失败,并在多行上拆分应该在同一实体内的标记。
为了解决这个问题,我创建了自己的模型来检测简历中的句子。现在,我想将文档上传到 Watson,而不是让它尝试重新分割句子。我管理的最佳方法是每次我的模型预测一个句子中断时,两个换行。多亏了这一点,Watson 从不将不同的句子连接在一起。但是,它有时会认为缺少一个断句并添加一个新的断句。
如何在 Watson Knowledge Studio 中停用句子边界检测?
watson-knowledge-studio - Watson Knowledge studio,字典更新没有体现在当前任务中
如何在 Watson Knowledge Studio 中更新字典并将更改应用到已启动人工注释的当前任务中。我更新了字典(即添加了一些需要的关键字)并应用了预注释。当前任务的注释集中未更新字典中的更改。有没有办法我们可以做到?
ibm-watson - 以编程方式改进 Watson 的自定义模型
有没有办法以编程方式将文档加载到 WKS(Watson Knowledge Studio)中创建注释集和任务并以编程方式注释文档?这样做可能允许改进来自外部应用程序的自定义模型,这可能会提示用户识别某些文本的 NLP 分析对于他们的域上下文是否正确。
storage - IBM Watson 知识:为什么存储不会减少
当我转到训练模型时,出现错误:“机器学习模型训练过程失败。:此操作无法完成,因为模型大小超过订阅存储大小 5 GB。” 昨天我删除了所有快照,但现在存储空间为 6Gb。为什么到目前为止存储没有减少?
ibm-watson - 可供下载的字典的位置
IBM Watson Knowledge Studio 中使用的词典在哪里可以下载?谢谢!
ibm-watson - WKS - 识别表上实体的训练模型
浏览器类型和版本:GoogleChrome 67.0.3396.99
我们正在尝试训练我们的模型来识别来自包含不同行数和列数的多种类型的表的值。提取文本行以开始训练,首先我们配置系统类型,然后标记实体以及关系“AllInOne”。我们可以在一个训练集中训练 10 个关系,但是在测试模型时,我们只能看到 8 个关系,甚至创建其他文档集来训练和多次测试模型。考虑到我们使用 Discovery 服务分析的表类型没有标准,是否有另一种方法可以将列值与单个关系中的行值关联起来?
我们期望发现服务响应如下:
named-entity-recognition - IBM Watson NLU 中货币实体到实体提取的低分
我正在尝试使用 NLU 和 WKS 从文本文档中提取一些实体和关系。我得到了很好的结果,但我想了解为什么 Watson NLU 在类似文档中无法识别我的自定义模型的某些实体,例如:
Watson 在 Text 2 和 Text 3 上识别出我的实体和关系,但在 Text 1 中却没有。同样的事情发生在:
标记的文档样本:
数据集:
- 训练集:250 个文档(85%)
- 测试集:35 个文档(12%)
盲集:10 份文件 (3%)
我已经使用了其他拆分。
- 所有文档都有实体和关系,一次按文档,有差异。
我已经用这种情况标记了更多文档,但它并没有改善结果。另一项测试是将任何货币标记到文件中。
我可以做些什么来改善结果?
ibm-watson - 在生产中部署 IBM WKS 实验性基于规则的模型:这样做是否可取?
我想知道是否建议在生产中部署使用 IBM Watson Knowledge Studio (WKS) 创建的基于规则的模型,因为它是一个实验性功能。
IBM 文档明确建议不要在生产中使用其实验性功能:https ://console.bluemix.net/docs/services/watson-knowledge-studio/troubleshooting.html#experimental 。
但是,IBM Watson Knowledge Studio 2.0 的一篇旧文章- 部署基于规则的模型是实验性的。这意味着什么?似乎保证了这个功能实际上是稳定的,并且将来不会被删除。同时,在https://developer.ibm.com/answers/questions/440983/is-my-wks-experimental-data-lost/上发布的最新帖子显示了部署其实验性 WKS 项目的人发生了什么,然后失去了它(即使那篇文章不是关于基于规则的模型)。
先感谢您!
ibm-watson - 在 WKS 上使用负面提及类
在使用 WKS 开发用于提取 CV 信息的自定义机器学习模型时,我们开始怀疑是否仅当提及与另一个提及有关系时,使用负面提及类别特征进行注释才会对模型产生影响,即出现问题是因为可以将提及类从特定(在第一个注释任务上分配的默认类)更改为否定而不需要创建关系,但我们不知道这种使用否定提及类的方式是否有用全部。
我们已经知道 ML 模型从正例和负例中学习(不加注释就留下提及),使用负提及类特征会进一步提高模型的性能吗?我们问这个是因为,显然我们不知道 WKS 是如何在后台详细工作的。