问题标签 [custom-training]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 具有一些不可训练权重的自定义 Keras 层
我想在顺序模型中有一个层,它有一些固定的、不可训练的权重,稀疏地分布在层内。
例如:我创建了一个层数很少的模型
然后我编译并拟合模型并获得具有训练权重的两层。
接下来,我想例如model.layer[0]
修改和修复一些权重,然后对网络进行再训练。
例如,训练层是
我希望它是这样的:
使用 A*、F*、H* 和 I* 编辑权重并设置为不可训练,因此在另一轮训练之后,该层会产生类似这样的结果
我的网络是在 Keras 中构建的,我没有找到进行这种转换的方法。甚至可能吗?我考虑过创建一个自定义层,但我不知道如何只使某些值不可训练。
python - Keras 后端 set_value() 或 batch_set_value() EagerTensor 赋值问题
我正在尝试修复 Keras Dense 层的一些权重,并使它们不可训练。我发现有效的解决方案在我之前提出的问题中进行了描述。
我正在创建一个密集层
我创建了一个处理约束的类:
weights
是一个代表层的起始权重的ndarray,例如
whileweights_nan
是一个 ndarray,其中一些权重发生了变化,其他的设置为 NaN:
constraint_fix
将最后一个数组作为参数,并仅设置密集层的权重,让另一个在训练期间自由更改。
我的问题不在于这个操作计算量很大,因为网络实际上更大并且有很多层,并且在每个训练步骤constraint_fix()
都被唤起并迭代 for 循环。
有没有一种方法可以加快进程并一步更新所有所需的层权重?我想过,K.batch_set_value()
但我无法让它发挥作用,因为如果我让
输出是
我究竟做错了什么?(可能一切,但是)我怎样才能达到预期的结果?
architecture - 基于云的虚拟实验室环境架构
我想知道如何在 AWS 或 Azure 等云提供商和使用 ACloudGuru、Linkedin Learning、Pluralsight 等培训网站的虚拟实验室的学生之间创建学生 UI。虚拟实验室环境和 GUI 怎么样被建造?它是专有解决方案、第三方软件还是来自云提供商的 API?如果我想创建一个类似的解决方案,除了云提供商,我还应该使用什么?
python - 在 deepspeech 内部训练期间出错:无法使用模型配置调用 ThenRnnForward:[rnn_mode, rnn_input_mode, rnn_direction_mode]
尝试执行时出现以下错误
tensorflow.python.framework.errors_impl.InternalError:发现 2 个根错误。(0) 内部:使用模型配置调用 ThenRnnForward 失败:[rnn_mode, rnn_input_mode, rnn_direction_mode]: 2, 0, 0, [num_layers, input_size, num_units, dir_count, max_seq_length, batch_size, cell_num_units]: [1, 2048, 2048, 1, 798, 64, 2048] [[{{node tower_0/cudnn_lstm/CudnnRNNV3}}]] [[tower_0/gradients/tower_0/BiasAdd_2_grad/BiasAddGrad/_87]] (1)内部:使用模型配置调用 ThenRnnForward 失败: [rnn_mode, rnn_input_mode, rnn_direction_mode]: 2, 0, 0, [num_layers, input_size, num_units, dir_count, max_seq_length, batch_size, cell_num_units]: [1, 2048, 2048, 1, 798, 64, 2048] [[{{node tower_0/cudnn_lstm/CudnnRNNV3}}]] 0 次成功操作。0 派生错误被忽略。
python-3.x - how to apply ModelCheckpoint in a custom training loop for tensorflow 2.0?
we can set tf.keras.callbacks.ModelCheckpoint()
, then pass a callbacks
argument to fit()
method to save the best modelcheckpoint, but how to make the same thing in a custom training loop?
tensorflow - 如何在我的 GPU 而不是我的 CPU 上运行 ImageAI
所以我对此很陌生,我试图在谷歌上找到答案,但它有点不起作用。所以我正在尝试运行这个库ImageAI 库
我能够在 CPU 上正常运行它,至少我认为它只需调用 python test.py 就可以在 CPU 上运行。我在那里正确吗
但由于模型预测需要很长时间,我想在我的 GPU 上运行它。我试图做的是创建一个 conda 环境并激活它,但是在我这样做之后我得到了这个错误。
ModuleNotFoundError: No module named 'imageai.Classification'
虽然我在我的环境中安装了 imageai
正如您通过执行此命令所看到的。我在这里做错了什么?
python - 使用 torch.save 和 torch.load 继续培训 - 关键错误消息
我是 Torch 的新手,并且使用了一个用于 masked-cnn 模型的代码模板。为了在培训中断时做好准备,我在代码中使用了 torch.save 和 torch.load,但我认为我不能单独使用它来继续培训课程?我开始训练:
这调用了函数 train_mask_net,其中我在 epoch 循环中包含了 torch.save。我想加载其中一个保存的模型并在循环前使用 torch.load 继续训练,但我收到了优化器、损失和 epoch 调用的“关键错误”消息。我应该像在一些教程中看到的那样创建一个特定的检查点功能,还是有可能我可以继续使用 torch.saved 命令保存的文件进行培训?
我认为没有必要,但是 xceptionhour 类看起来像这样:
python - 您可以从单个 anaconda 提示符运行培训和评估过程吗?
在训练 Tensorflow2 自定义对象检测器期间,我无法评估我的训练过程。在阅读了与这个问题相关的几个问题后,我发现评估和培训应该被视为两个独立的过程,因此我应该使用新的 anaconda 提示符来开始评估工作。我正在使用 ssd_mobilenetv2 640x640 版本进行培训。我的管道配置:
我已经使用以下命令开始了培训:
我希望设置评估示例的数量会对开始评估工作产生影响。在任何情况下,我都尝试在不同的终端窗口中运行评估:python model_main_tf2.py --model_dir=models/my_ssd2_3 --pipeline_config_path=models/my_ssd2_3/pipeline.config --checkpoint_dir=models/my_ssd2_3/ --alsologtostderr
一旦开始评估,训练作业就会因以下错误而崩溃:错误
我认为我没有足够的硬件的问题:
- 8GB 内存
- 英伟达 GTX960M(2GB 内存)
我使用的所有输入图像都是 3000x3000 是否是个问题,因此预处理器必须加载太多信息?如果是这样,有没有办法解决它?我不想在生成 TF 记录文件之前调整所有图像的大小,因为我必须重新标记所有图像。我显然缺乏在培训过程开始期间如何分配内存的洞察力,因此非常感谢一些细节。
第二个问题是,在 tensorboard 上监视训练期间,图像以各种亮度显示,我尝试在 model_lib_v2.py 文件中将 627 行更改为:
根据这个解决方案:https ://github.com/tensorflow/models/issues/9115 没有任何运气。这个问题有解决方案吗?如果我可以在那里监视模型提出的边界框,那将是很好的。谢谢你。
artificial-intelligence - 自定义培训 将 PDF 提取到表格中
我有一个PDF
包含表格的文件,我想将其转换为表格结构化数据。
我的PDF
文件包含一个非常复杂的表格,这使得大多数工具都不够用。例如,我尝试使用以下工具,但它们没有很好地提取它:AWS Textract
, Google AI Document
, Google Vision
, Microsoft Text Recognition
. 实际上,Google AI Document
设法做到了大约 70% 的正确率,但这还不够好。
所以,我搜索了一种自定义训练模型的方法,以便在提取此表时,它会正确提取它。我尝试了 Power Apps AI Builder 和Google AutoML
实体提取,但它们都没有帮助(顺便说一句,我不是 AutoML 的目的,它是用于预测还是也可以自定义表提取?)。
我想知道哪些工具适合我的用例,以及是否有任何(AI)工具可以用来训练这类表格,以便文本提取更好。
nlp - GPT-2 会话/讨论的特定培训
我目前在会话多项选择上下文中使用 GPT-2 模型。
用法如下:2个对话者在同一个房间,一个对话者提出一个问题,第二个对话者有4个选择答案。
今天,我只使用选择的答案重新训练我的模型。我怎样才能整合非选择?如何惩罚未选择的答案?
我期待着你的想法和创造力:)
祝你有美好的一天,贾斯汀