“google-cloud-automl-nl”的相关标签问题

0 投票

1 回答

54 浏览

python - 不接受 AutoML 语言实体提取 score_threshold 作为参数

环境细节

操作系统类型和版本：Windows 10、WSL 2、Ubuntu 16.04
Python版本：3.7.5
点子版本：19.3.1
google-cloud-automl版本：2.2.0

重现步骤

使用 score_threshold 作为参数调用 AutoML 语言实体提取

代码示例堆栈跟踪

2021-03-16T17:21:03.990

0 投票

0 回答

15 浏览

nlp - 还有什么可以触发 NLP 自动 ML 错误的少量数据点进行训练？

我正在尝试为单分类模型运行 Google auto ML NLP 我的数据集的一些值刚好高于训练的最低要求：注意：它已排序以显示带有最少注释的标签

但是后来我尝试开始培训我收到了这个错误：

无法开始训练：要开始训练模型，需要每个注释规范有 8 个用于训练的注释、1 个用于验证的注释和 1 个用于测试的注释。当前数据集不满足最低要求。请在训练之前使用这些注释规范导入更多数据：[标签]。

我是在解析这个错误还是它要求我已经遇到的参数？

我应该怎么做才能解决这个问题？

nlp google-cloud-automl google-cloud-automl-nl

2021-03-17T18:10:04.467

0 投票

0 回答

47 浏览

google-cloud-platform - 自定义命名实体提取预测标签为 NULL

我正在使用 Google Cloud Platform (AutoML) 工具来构建自定义实体提取器模型。我导入了原始文本句子，并使用谷歌云平台的内置工具对其进行注释。我开始训练模型。测试集中的预测标签在混淆矩阵中都被分类为 NULL，如下图所示，这是不正确的。混淆矩阵图像我分析了预测的句子，模型能够识别大多数标签中的实体。但是，由于某种原因，该模型仍将这些实体识别为误报。句子中的预测标签

有人可以提出一个可能的解决方案来解决这个问题吗？是什么导致了平台的这种不稳定行为？

google-cloud-platform automl google-ai-platform google-cloud-automl-nl

2021-03-31T19:17:27.223

0 投票

1 回答

43 浏览

google-cloud-platform - 在 AutoML Vision 中使用连续变量作为标签

我想知道是否有人在 AutoML Vision平台中成功地用连续变量标记图像。

具体来说，我想从鸟瞰照片中预测沙堡的高度。我会在标有高度（以英寸为单位）的沙堡鸟瞰照片上训练模型。我的数据集中有 10,000 张图像。我的数据集中的高度范围是 1cm 到 110cm，所以变量是连续的，但不是无限的。

这可以通过 Google AutoML Vision 实现吗？

谢谢！

google-cloud-platform computer-vision google-cloud-automl automl google-cloud-automl-nl

2021-04-17T15:53:28.580

0 投票

0 回答

27 浏览

nlp - GCP AutoML Natural Language 中 Word Boundary 的 PDF 标注问题

我正在使用 250 个 PDF 的样本数据集对 GCP NLP 进行试验，目标是执行实体提取，从每个文档中提取大约 50 个左右的实体。很多实体都是美元金额和百分比，但是当突出显示以特殊字符开头或结尾的值（例如：$ 和 %）时，我遇到了警告。例如，假设我试图提取“合同价值”之类的东西，当我在 GCP NLP 的标签器中突出显示美元金额时，如果我包含美元符号，我会收到以下关于在单词边界上进行注释的警告（参见第 1下图）。当我只是突出显示实际值时（见第二张图片），我没有问题。如果我要突出显示整个字符串（例如：“合同价值为 20 美元”），它将接受该值罚款（$ 位于字符串中间）。

我的问题是，我是否应该避免包含美元符号和其他触发此警告的字符？我确实需要整个字符串，而不仅仅是数字，但我担心它可能会导致模型质量不佳（根据警告）。

如前所述，我有大约 250 个文档，所以我想从一开始就给事情贴上“正确”的标签，所以任何提示或解释都将不胜感激！