问题标签 [custom-training]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
106 浏览

python - 具有一些不可训练权重的自定义 Keras 层

我想在顺序模型中有一个层,它有一些固定的、不可训练的权重,稀疏地分布在层内。

例如:我创建了一个层数很少的模型

然后我编译并拟合模型并获得具有训练权重的两层。

接下来,我想例如model.layer[0]修改和修复一些权重,然后对网络进行再训练。

例如,训练层是

我希望它是这样的:

使用 A*、F*、H* 和 I* 编辑权重并设置为不可训练,因此在另一轮训练之后,该层会产生类似这样的结果

我的网络是在 Keras 中构建的,我没有找到进行这种转换的方法。甚至可能吗?我考虑过创建一个自定义层,但我不知道如何只使某些值不可训练。

0 投票
0 回答
82 浏览

python - Keras 后端 set_value() 或 batch_set_value() EagerTensor 赋值问题

我正在尝试修复 Keras Dense 层的一些权重,并使它们不可训练。我发现有效的解决方案在我之前提出的问题中进行了描述。

我正在创建一个密集层

我创建了一个处理约束的类:

weights是一个代表层的起始权重的ndarray,例如

whileweights_nan是一个 ndarray,其中一些权重发生了变化,其他的设置为 NaN:

constraint_fix将最后一个数组作为参数,并仅设置密集层的权重,让另一个在训练期间自由更改。

我的问题不在于这个操作计算量很大,因为网络实际上更大并且有很多层,并且在每个训练步骤constraint_fix()都被唤起并迭代 for 循环。

有没有一种方法可以加快进程并一步更新所有所需的层权重?我想过,K.batch_set_value()但我无法让它发挥作用,因为如果我让

输出是

我究竟做错了什么?(可能一切,但是)我怎样才能达到预期的结果?

0 投票
0 回答
16 浏览

architecture - 基于云的虚拟实验室环境架构

我想知道如何在 AWS 或 Azure 等云提供商和使用 ACloudGuru、Linkedin Learning、Pluralsight 等培训网站的虚拟实验室的学生之间创建学生 UI。虚拟实验室环境和 GUI 怎么样被建造?它是专有解决方案、第三方软件还是来自云提供商的 API?如果我想创建一个类似的解决方案,除了云提供商,我还应该使用什么?

0 投票
2 回答
130 浏览

python - 在 deepspeech 内部训练期间出错:无法使用模型配置调用 ThenRnnForward:[rnn_mode, rnn_input_mode, rnn_direction_mode]

尝试执行时出现以下错误

tensorflow.python.framework.errors_impl.InternalError:发现 2 个根错误。(0) 内部:使用模型配置调用 ThenRnnForward 失败:[rnn_mode, rnn_input_mode, rnn_direction_mode]: 2, 0, 0, [num_layers, input_size, num_units, dir_count, max_seq_length, batch_size, cell_num_units]: [1, 2048, 2048, 1, 798, 64, 2048] [[{{node tower_0/cudnn_lstm/CudnnRNNV3}}]] [[tower_0/gradients/tower_0/BiasAdd_2_grad/BiasAddGrad/_87]] (1)内部:使用模型配置调用 ThenRnnForward 失败: [rnn_mode, rnn_input_mode, rnn_direction_mode]: 2, 0, 0, [num_layers, input_size, num_units, dir_count, max_seq_length, batch_size, cell_num_units]: [1, 2048, 2048, 1, 798, 64, 2048] [[{{node tower_0/cudnn_lstm/CudnnRNNV3}}]] 0 次成功操作。0 派生错误被忽略。

0 投票
0 回答
114 浏览

python-3.x - how to apply ModelCheckpoint in a custom training loop for tensorflow 2.0?

we can set tf.keras.callbacks.ModelCheckpoint(), then pass a callbacks argument to fit() method to save the best modelcheckpoint, but how to make the same thing in a custom training loop?

0 投票
1 回答
141 浏览

tensorflow - 如何在我的 GPU 而不是我的 CPU 上运行 ImageAI

所以我对此很陌生,我试图在谷歌上找到答案,但它有点不起作用。所以我正在尝试运行这个库ImageAI 库

我能够在 CPU 上正常运行它,至少我认为它只需调用 python test.py 就可以在 CPU 上运行。我在那里正确吗

但由于模型预测需要很长时间,我想在我的 GPU 上运行它。我试图做的是创建一个 conda 环境并激活它,但是在我这样做之后我得到了这个错误。

ModuleNotFoundError: No module named 'imageai.Classification'

虽然我在我的环境中安装了 imageai

正如您通过执行此命令所看到的。我在这里做错了什么?

0 投票
1 回答
248 浏览

python - 使用 torch.save 和 torch.load 继续培训 - 关键错误消息

我是 Torch 的新手,并且使用了一个用于 masked-cnn 模型的代码模板。为了在培训中断时做好准备,我在代码中使用了 torch.save 和 torch.load,但我认为我不能单独使用它来继续培训课程?我开始训练:

这调用了函数 train_mask_net,其中我在 epoch 循环中包含了 torch.save。我想加载其中一个保存的模型并在循环前使用 torch.load 继续训练,但我收到了优化器、损失和 epoch 调用的“关键错误”消息。我应该像在一些教程中看到的那样创建一个特定的检查点功能,还是有可能我可以继续使用 torch.saved 命令保存的文件进行培训?

我认为没有必要,但是 xceptionhour 类看起来像这样:

0 投票
1 回答
80 浏览

python - 您可以从单个 anaconda 提示符运行培训和评估过程吗?

在训练 Tensorflow2 自定义对象检测器期间,我无法评估我的训练过程。在阅读了与这个问题相关的几个问题后,我发现评估和培训应该被视为两个独立的过程,因此我应该使用新的 anaconda 提示符来开始评估工作。我正在使用 ssd_mobilenetv2 640x640 版本进行培训。我的管道配置:

我已经使用以下命令开始了培训:

我希望设置评估示例的数量会对开始评估工作产生影响。在任何情况下,我都尝试在不同的终端窗口中运行评估:python model_main_tf2.py --model_dir=models/my_ssd2_3 --pipeline_config_path=models/my_ssd2_3/pipeline.config --checkpoint_dir=models/my_ssd2_3/ --alsologtostderr
一旦开始评估,训练作业就会因以下错误而崩溃:错误

我认为我没有足够的硬件的问题:

  1. 8GB 内存
  2. 英伟达 GTX960M(2GB 内存)

我使用的所有输入图像都是 3000x3000 是否是个问题,因此预处理器必须加载太多信息?如果是这样,有没有办法解决它?我不想在生成 TF 记录文件之前调整所有图像的大小,因为我必须重新标记所有图像。我显然缺乏在培训过程开始期间如何分配内存的洞察力,因此非常感谢一些细节。


第二个问题是,在 tensorboard 上监视训练期间,图像以各种亮度显示,我尝试在 model_lib_v2.py 文件中将 627 行更改为:

根据这个解决方案:https ://github.com/tensorflow/models/issues/9115 没有任何运气。这个问题有解决方案吗?如果我可以在那里监视模型提出的边界框,那将是很好的。谢谢你。

0 投票
1 回答
67 浏览

artificial-intelligence - 自定义培训 将 PDF 提取到表格中

我有一个PDF包含表格的文件,我想将其转换为表格结构化数据。

我的PDF文件包含一个非常复杂的表格,这使得大多数工具都不够用。例如,我尝试使用以下工具,但它们没有很好地提取它:AWS Textract, Google AI Document, Google Vision, Microsoft Text Recognition. 实际上,Google AI Document设法做到了大约 70% 的正确率,但这还不够好。

所以,我搜索了一种自定义训练模型的方法,以便在提取此表时,它会正确提取它。我尝试了 Power Apps AI Builder 和Google AutoML实体提取,但它们都没有帮助(顺便说一句,我不是 AutoML 的目的,它是用于预测还是也可以自定义表提取?)。

我想知道哪些工具适合我的用例,以及是否有任何(AI)工具可以用来训练这类表格,以便文本提取更好。

在此处输入图像描述

0 投票
0 回答
18 浏览

nlp - GPT-2 会话/讨论的特定培训

我目前在会话多项选择上下文中使用 GPT-2 模型。

用法如下:2个对话者在同一个房间,一个对话者提出​​一个问题,第二个对话者有4个选择答案。

今天,我只使用选择的答案重新训练我的模型。我怎样才能整合非选择?如何惩罚未选择的答案?

我期待着你的想法和创造力:)

祝你有美好的一天,贾斯汀