问题标签 [nl-classifier]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python NLTK Classifier.train(trainfeats)... ValueError: need more than 1 value to unpack
运行此代码时出现以下错误...
错误来自分类器 = NaiveBayesClassifier.train(trainfeats) 行,我不知道为什么。我以前做过类似的事情,我的 trainfeats 接缝的格式与当时的格式相同……下面列出了格式中的一个示例……
[[({'me': True, 'af': True, 'this': True, 'joy': True, 'high': True, 'hookah': True, 'got': True}, 'pos' )]]
我的 trainfeats 还需要什么其他值来创建分类器?强调文本
ibm-watson - 自然语言分类器返回未训练项目的分类
我对 NLC 的工作方式感到困惑。我的期望是,当它被要求对不应该有任何关系或训练数据来学习的文本进行分类时,应该不会返回任何结果或置信度分数非常低的结果。
我已经用一组训练数据训练了一个模型,当我尝试对训练数据之外的文本进行分类时,我得到的结果具有高置信度值(~60%)。
这是我的训练数据的示例:
当我尝试对文本“这不应该存在”进行分类时,我高度相信该文本是“1”。
我的假设是否正确,因为在这种情况下我应该返回值?我是否在训练数据以错误地对 foo、bar 和 baz 进行分类?如果不是,我应该从 NLC 服务中得到什么?
ibm-watson - 通过 api 加载的 NLC 训练数据在工具包中不可见
我已经通过 NLC api 加载了一组训练数据,并且我没有将这些类视为可通过 blue mix 获得的训练 UI 中的选项。此外,我通过 API 发送的查询并未显示为可能的训练数据集的一部分。这是正常行为吗?
java - IBM Watson - 自然语言分类器服务 (Java SDK) - deleteClassifier() 方法不会删除分类器
我正在尝试在 IBM Watson 平台的自然语言分类器服务中调用 deleteClassifier() 方法,操作完成但不会删除分类器。这是我的代码和输出:
代码:
输出:
删除前:
删除后:
已接_JAVA_OPTIONS: -Xmx512M -Xms512M
我在这里做错了吗?
python - IBM Watson nl-c 培训时间
我有一个包含大约 14,700 条记录的数据集。我希望在 ibm watson 上对其进行培训,目前我正在试用版。分类器训练所需时间的粗略估计是多少?数据集的每条记录都包含一个句子,第二列包含类名。
ibm-cloud - 我无法打开 NLC 工具包 - 授权码无效
我正在尝试使用自然语言分类器 IBM Watson 开发一些东西。但是当我试图打开工具包时,我得到了这个:
这一切都来自 NLC Toolkit。
ibm-watson - 为什么 Watson NLC 对训练(1024 个字符)和生产(2048 个字符)有不同的大小限制?
IBM Watson 自然语言分类器 (NLC) 将训练集中的文本值限制为 1024 个字符: https ://console.bluemix.net/docs/services/natural-language-classifier/using-your-data.html#training-限制。
然而,经过训练的模型可以对长度最多为 2048 个字符的每个文本进行分类: https ://console.bluemix.net/apidocs/natural-language-classifier#classify-a-phrase 。
这种差异给我带来了一些困惑:我一直都知道我们应该在训练阶段和生产阶段应用相同的预处理,因此如果我不得不将训练数据限制在 1024 个字符,我也会在生产中做同样的事情.
我的推理是否正确?我应该将生产中的文本限制在 1024 个字符(我认为我应该)还是 2048 个字符(可能是因为 1024 个字符太少)?
先感谢您!
artificial-intelligence - 如何解决 ibm watson nlc 中的权利错误?
我正在尝试在我的计算机上本地训练 IBM Watson NLC,训练几分钟后它向我显示此错误
ibm-watson - Watson Classifier curl 身份验证失败,用户 ID 和密码
我按照说明检索了https://gateway.watsonplatform.net/natural-language-classifier/api的凭据- 从资源列表中我能够检索到我的用户名和密码。我有一个训练有素的分类器,可以与 Watson Studio 一起使用。我从 Watson 服务页面为我的项目检索到的分类器是:befb8ax501-nlc-1441。然后我尝试测试一个简单的测试 - curl -u "{userid}":"{password}" " https://gateway.watsonplatform.net/natural-language-classifier/api/v1/classifiers/befb8ax501-nlc -1441" 我收到 {"code":401, "error": "Unauthorized"} 这似乎非常基本和简单,但我似乎无法让它工作。我使用 curl 因为我编写的 python 程序(其中几个月前使用不同的密码和服务 ID 工作)似乎没有工作。我可以使用 Web 界面执行操作,因此服务正在工作 - 但我似乎无法调用它。有没有办法我可以测试我的用户名和密码吗?我是否使用正确的格式拨打电话?
machine-learning - IBM Watson NLC - 使用超过 20,000 个文本示例进行培训?
我们目前正在开发一个系统,该系统将从文本输入中返回 ICD10-CM 代码(一种医疗/诊断编码系统)。例子
- 输入“黑眼”
- return 'H44 - 全球疾病'
问题是,ICD10-CM 有 70,000 到 100,000 个代码,所以在我从 .csv 文件上传所有这些文本示例后,它不会让我训练模型。
使用多个模型是一种解决方案还是应该切换到 Google 的 AutoML?