问题标签 [tensorflow-model-garden]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
134 浏览

python - 为什么我在 WiSe 数据集中使用 DeepLab v3+ 得到完全零预测,即使损失不断减少?

我正在尝试在 WiSe 数据集( https://cvhci.anthropomatik.kit.edu/~mhaurile/wise/ )上训练DeepLab v3+ 模型( https://github.com/tensorflow/models/research/deeplab/) . 我已经修改了提供的脚本中的参数并开始运行脚本,但即使损失不断减少(从步骤 10 的大约 2.7 到步骤 100 的大约 1.9),我在导出的预测中得到全零检查站。即使在每张火车图像上,我都得到了一个全零的预测。 数据集信息(我已经处理了数据集以满足我的需要): 训练图像:1222 Val 图像:100 总图像:1322 总类:9(包括背景)train.py





类:['background', 'TitleSlide', 'PresTitle', 'ImageCaption', 'Image', 'Code', 'Enumeration', 'Tables', 'Paragraph'] \

我将以下代码添加到datasets/data_generator.py

请注意,在我的数据集中,实际上没有图像具有标签为 255 的任何像素。每个标签都在 [0, 8] 范围内。我也尝试设置num_classes为9,但没有任何成功。
我的目录结构如下:

我用来运行培训的命令:

请注意,我已设置initialize_last_layer = Falselast_layers_contain_logits_only = False。我使用了 ImageNet 预训练的 Xception-65 模型作为骨干网络,我从这里给出的链接下载了它(具体来说,我使用了xception_65_imagenet)。
我还做了以下更改utils/train_utils.py

当我执行训练时,它可以成功进入训练部分,现在已经训练到大约 110 步。我使用以下命令导出了一个中间检查点:

检查点成功导出。然后我尝试使用此处给出的示例笔记本运行推理。具体来说,当我运行以下部分时,0会在输出中打印:

任何给定的图像都会发生同样的情况。为什么会这样?任何帮助将不胜感激。

0 投票
1 回答
131 浏览

tensorflow - 关于 TensorFlow 对象检测 api 和不是 jpeg 的图像/格式的问题(例如 dicom 或 numpy 数组)

我喜欢使用来自 tensorflow 的对象检测 api 和 dicom 图像而不是 jpg。

在文档中: https ://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#create-tensorflow-records 我找到以下代码

我已经成功保存了具有上述格式的 tfrecord,其中 encoded_jpg 是 dicom 文件的 numpy 数组的字节串。

  1. 但是我问自己如何设置 image_format 以及这是否需要以及记录在哪里?
  2. 此外,我想知道通常是否可以将 tensorflow 反对 api 与 dicom 文件一起使用,或者 tensorflow 对象检测 api 是否仅限于 jpg。

@j2abro 我希望明确不要将我的 dicom 图像转换为 jpeg,因为据了解,jpeg 每像素 8 位,而我的 dicom 文件每像素 12 位。我想使用我的数据的无损版本。

0 投票
1 回答
120 浏览

tensorflow - BERT 模型微调和迁移到 TF2

我执行了这个优秀的教程: https ://towardsdatascience.com/building-a-multi-label-text-classifier-using-bert-and-tensorflow-f188e0ecdc5d

我理解了大部分内容,除了创建模型的地方。我想知道它并迁移到 TF2 伯特。

  1. 当他说“基本上我们加载预训练的模型,然后训练最后一层进行分类任务。”时,这是否意味着他正在冻结所有其他层并微调最后一层?这是我无法理解的相关代码(在 TF1 中):
  1. 我浏览了 BERT 的 TF2 微调教程,但我该如何实现呢?我能够训练不需要步骤 1 的其他模型。
0 投票
1 回答
567 浏览

python-3.x - “[Errno 38] Function not implemented:”在 Azure 机器学习上安装 Tensorflow 对象检测 API 时发生

我尝试使用 API 文档中描述的以下命令在 Azure 机器学习上安装带有 Tensorflow 2 的对象检测 API :

但是当我执行上面(python -m pip install ...)的最后一个代码时,我得到了以下错误。错误太长,错误的每一行都说[Errno 38] Function not implemented:. 错误的尾部如下所示:

我已经确认在我的本地 PC 上安装了相同的命令是成功的。如果我想在 Azure 机器学习上安装它,我需要做一些不同的事情吗?

0 投票
1 回答
669 浏览

object-detection-api - 使用 tensorflow 对象检测 api 训练 CenterNet MobileNetV2 FPN 512x512 时出现错误“indices[0] = 0 not in [0,0)”

我正在根据本指南运行 tensorflow 对象检测 api https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#configuring-a-training-job但是稍微有点修改了用于制作记录文件的代码并使用以下系统:

系统信息:

  • 操作系统平台和发行版:Ubuntu 20.04.1 LTS
  • 蟒蛇版本:
  • TensorFlow 版本:2.4.0
  • CUDA/cuDNN 版本:11.0/8.0.5
  • GPU 型号和内存:GeForce RTX 3090、24268 MiB

我想将模型 CenterNet MobileNetV2 FPN 512x512 用于来自 TensorFlow2 检测模型动物园(https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2_detection_zoo.md)的框。

我根据然后运行的指南设置了培训工作

这样做时我收到以下错误

当谷歌搜索此错误时,会出现一些答案,即错误是在创建 TFRecord 文件时,您需要include_masks在创建它们时添加。但是,当从模型动物园运行其他 CenterNet 模型时,我没有收到此错误,所以这似乎很奇怪,这将是错误。

任何想法,如果它可以是别的什么?

0 投票
1 回答
515 浏览

tensorflow - 如何准备 imagenet 数据集以运行 resnet50(来自官方 Tensorflow 模型花园)培训

我想在我的本地 GPU 服务器上的 imagenet2012 数据集上训练一个 resnet50 模型,完全遵循这个 Tensorflow 官方页面:https ://github.com/tensorflow/models/tree/master/official/vision/image_classification#imagenet-preparation 但是,我不知道如何准备 imagenet2012 训练和验证数据集,以便我可以像这样开始训练:

具体来说,我已将数据集下载为两个 tar 文件:ILSVRC2012_img_train.tarILSVRC2012_img_val.tar\myPath目录,按照说明:https ://github.com/tensorflow/datasets/blob/master/docs/catalog/imagenet2012.md#imagenet2012 谁能告诉我准备数据集和设置配置的确切步骤(通过命令行参数或在 configs/examples/resnet/imagenet/gpu.yaml 中设置)。

PS1,我注意到训练脚本可以使用两种类型的数据集:1)使用 TFDS 2)使用 TFRecords我已经使用页面底部的 shell 脚本创建了 TFRecords 数据集,但仍然不知道如何设置配置。TFDS似乎是TF推荐的,但只要我能成功运行培训,我就可以接受TFRecords格式。目前,我已经有以下形式的训练和验证 TFRecords 文件:

PS2:希望 TF 社区可以为像我这样的初学者提供一个清晰的逐步准备 imagenet 数据集的指南。将不胜感激!

0 投票
1 回答
160 浏览

tensorflow - 为什么用 32768 作为常数来规范 VGGish 中的 wav 数据?

我正在尝试了解代码为 VGGish 所做的事情,但我遇到了一个我不太了解的部分。在 vggish_input.py 中有这样的:

32768 的常数从何而来,如何除以将数据转换为样本?

我发现它可以转换为 -1 和 +1,但不确定如何将其与 32768 连接起来。

https://stats.stackexchange.com/questions/178626/how-to-normalize-data-between-1-and-1

0 投票
1 回答
205 浏览

tensorflow - 如何使用tensorflow/models/research/object_detection/models下的模型

我正在研究使用 tensorflow 训练对象检测网络,并查看了 TF2 模型动物园。我注意到那里的模型明显少于目录 /models/research/models/ 中的模型,包括为 jetson xavier 开发的带有 ssdlite 的 mobiledet。

澄清一下,自述文件说有一个带有 ssdlite 的 mobildet gpu,并且提供了在 COCO 上训练的模型和检查点,但我在 repo 的任何地方都找不到它们

应该如何使用这些模型?

根据 mobilenetv3 论文,我已经有一个经过定制训练的用于图像分类的 mobilenetv3,我希望看到一种将网络变成对象检测网络的方法。如果这不简单,从头开始训练一个网络也可以,我只需要知道从哪里开始

0 投票
0 回答
44 浏览

tensorflow - 关于 reframe_box_masks_to_image_masks 的问题

我试图了解作物调整大小的reframe_box_masks_to_image_masks工作原理。我看到单位框是由模型生成的相对框坐标标准化的。假设我有一个盒子,[0.2, 0.2, 0.5, 0.5]:

标准化后,这应该给出 [-.667, -.667, 2.33, 2.33] 的反向框。使用 [15 x 15] 蒙版,调整大小的效果如何,尤其是。考虑超过[0,1]的坐标?

0 投票
1 回答
253 浏览

python - num_epochs 在 eval_input_config TF2 对象检测 API v2 中是什么意思

num_epochs在 pipeline.config 中意味着什么eval_input_config我注意到当我将此字段的值更改为大于 1 时,我 在尝试使用Tensorflow 对象检测 API 2训练对象检测模型时出现这些警告日志

[04/14 22:39:04] tensorflow WARNING: Ignoring detection with image id 163697061 since it was previously added