“pytorch-lightning”的相关标签问题

0 投票

1 回答

734 浏览

pytorch - AttributeError：“DataModuleClass”对象没有属性“training_dataset”

我正在尝试PyTorch Lightning通过编写一个非常简单的DataModuleClass. 之后prepare_data()，setup()我正在尝试检查这些功能是否正常工作。所以，我正在尝试从中获取training和validation数据集setup()。但我收到一个错误

代码

你能告诉我为什么我会收到这个错误吗？

pytorch pytorch-lightning

2021-05-08T13:44:29.613

0 投票

1 回答

614 浏览

pytorch - AttributeError：“元组”对象没有属性“train_dataloader”

我有一个 3 文件。在datamodule文件中，我创建了数据并使用了PyTorch Lightning. 在linear_model我linear regression model根据这个页面做了一个。最后，我有一个train文件，我正在调用模型并尝试拟合数据。但我收到了这个错误

示例数据模块文件

样本训练文件

如果您需要更多代码或解释，请告诉我。

更新（基于评论）

现在，self.prepare_data()从中删除，从中__init__()删除DataModuleClass()并将文件更改为return self.train_data, self.val_datasetup()test

错误：

pytorch pytorch-lightning

2021-05-08T16:43:00.137

0 投票

1 回答

115 浏览

python - 使用 PyTorch-ligtning 训练 RNN 时出现 AssertionError

我是 PyTorch 的新手，所以我使用 PyTorch-Lightning 来训练简单的（Vanilla）RNN：

1.数据准备

2.创建学习者类

3.创建模型并使用训练器

我有这个断言错误：

当我在 github https://github.com/pytorch/pytorch/blob/d09abf004cc16f8fd5f320e3d5d07c383c174ea7/torch/nn/modules/rnn.py#L247检查baseRNN时，我发现没有断言！

你能帮忙吗？

python pytorch pytorch-lightning

2021-05-12T23:34:22.367

0 投票

3 回答

1619 浏览

python - 如何保存模型的训练权重检查点并从 PyTorch 的最后一点继续训练？

我正在尝试在一定数量的时期后保存训练模型的检查点权重，并继续使用 PyTorch 从最后一个检查点训练到另一个时期为了实现这一点，我编写了如下脚本

训练模型：

由此，我可以将模型检查点文件保存checkpoint.pt为 5 个时期

为了使用保存的检查点权重文件继续训练，我在下面编写了另一个脚本：

这会引发错误：

我究竟做错了什么？我怎样才能解决这个问题？对此的任何帮助都会有所帮助。

python pytorch pytorch-lightning

2021-05-17T14:08:08.027

0 投票

2 回答

286 浏览

pytorch-lightning - TypeError：预期的数据是 int、Sequence 或 Mapping，但得到了方法 pytorch 闪电

我有这个 LightningDataModule：

然后我只是输入我的 LightningModule

但我目前收到错误“RuntimeError：输入、输出和索引必须在当前设备上”。

我目前正在使用 GPU 实例在 Colab 中运行它，但似乎没有任何东西可以让它工作。

谁知道怎么修它？

谢谢

pytorch-lightning

2021-05-26T21:03:35.577

0 投票

1 回答

307 浏览

pytorch-lightning - PytorchLightning 在 epoch 的所有步骤完成之前调用 training_epoch_end。总是大约 0.25 步长

我是 pytorch_lightning 的新手，我的训练进展顺利，但由于某种原因，training_epoch_end 在一些步骤后被调用，而不是在纪元结束时调用。

这些是我的输出：

GPU 可用：False，已使用：False

TPU 可用：无，使用：0 个 TPU 内核

验证健全性检查：0%| | 0/2 [00:00<?, ?it/s]

| 姓名 | 类型 | 参数

纪元 0：0%| | 0/13 [00:00<?, ?it/s]

纪元 0：23%|██▎ | 3/13 [01:38<05:27, 32.75s/it, loss=4.73, v_num=7]

//training_epoch_end: 输出 = [{'loss': tensor(6.4593)}, {'loss': tensor(5.7653)}, {'loss': tensor(1.9642)}]

验证：0it [00:00, ?it/s]

验证：0%| | 0/10 [00:00<?, ?it/s]

纪元 0：38%|███▊ | 5/13 [01:48<02:54, 21.78s/it, loss=4.73, v_num=7]

纪元 0：46%|████▌ | 6/13 [01:59<02:19, 19.91s/it, loss=4.73, v_num=7]

纪元 0：54%|█████▍ | 7/13 [02:10<01:51, 18.58s/it, loss=4.73, v_num=7]

纪元 0：62%|██████▏ | 8/13 [02:20<01:27, 17.60s/it, loss=4.73, v_num=7]

纪元 0：69%|██████▉ | 9/13 [02:31<01:07, 16.83s/it, loss=4.73, v_num=7]

纪元 0：77%|███████▋ | 10/13 [02:42<00:48, 16.21s/it, loss=4.73, v_num=7]

纪元 0：85%|████████▍ | 11/13 [02:52<00:31, 15.71s/it, loss=4.73, v_num=7]

纪元 0：92%|█████████▏| 12/13 [03:04<00:15, 15.34s/it, loss=4.73, v_num=7]

纪元 0：100%|██████████| 13/13 [03:15<00:00, 15.00s/it, loss=4.73, v_num=7]

纪元 0：100%|██████████| 13/13 [03:16<00:00, 15.15s/it, loss=4.73, v_num=7]

时期 1：23%|██▎ | 3/13 [01:42<05:42, 34.24s/it, loss=3.39, v_num=7]

//training_epoch_end: 输出 = [{'loss': tensor(2.6766)}, {'loss': tensor(2.3010)}, {'loss': tensor(1.1722)}]

纪元 1：31%|███ | 4/13 [01:48<04:04, 27.22s/it, loss=3.39, v_num=7]

验证：0it [00:00, ?it/s]

时期 1：38%|███▊ | 5/13 [02:02<03:15, 24.42s/it, loss=3.39, v_num=7]

已完成 6.8 MiB/327.9 MiB (48.7 KiB/s)，剩余 2 个文件

时期 1：100%|██████████| 13/13 [03:48<00:00, 17.54s/it, loss=3.39, v_num=7]

纪元 2：23%|██▎ | 3/13 [01:44<05:47, 34.72s/it, loss=2.72, v_num=7]

//training_epoch_end: 输出 = [{'loss': tensor(1.2504)}, {'loss': tensor(1.4905)}, {'loss': tensor(1.4158)}]

纪元 2：31%|███ | 4/13 [01:49<04:07, 27.48s/it, loss=2.72, v_num=7]

验证：0it [00:00, ?it/s]

时期 2：100%|██████████| 13/13 [03:50<00:00, 17.75s/it, loss=2.72, v_num=7]

时期 3：23%|██▎ | 3/13 [01:43<05:46, 34.62s/it, loss=2.27, v_num=7]

training_epoch_end: 3 个输出 = [{'loss': tensor(0.6632)}, {'loss': tensor(0.9215)}, {'loss': tensor(1.1396)}]

时期 3：31%|███ | 4/13 [01:49<04:06, 27.41s/it, loss=2.27, v_num=7]

验证：0it [00:00, ?it/s]

有谁知道为什么会这样？

工人或 GPU 的数量不影响订单。

谢谢！！！

pytorch-lightning

2021-05-31T07:25:40.253

0 投票

0 回答

41 浏览

pytorch-lightning - 在 pytorch 闪电中组织数据转换的最佳方法

我正在训练具有各种图像尺寸（50x50 到 200x200）的模型，我想尝试不同的模型，例如 torchvision 中可用的预训练模型。

转换示例：

放置此代码的最佳位置是什么，因此如果我使用不同的模型，我可以轻松更改其参数（例如：如果我需要更改输入图像大小/标准化参数？我还在使用 imgaug 库进行训练过程中的一些图像增强。

pytorch-lightning

2021-05-31T10:21:26.807

0 投票

0 回答

36 浏览

python - 为什么我不能使用 PyTorch Lightning 保存我的 RNN 模型检查点？

我创建了一个 ModelCheckpoint() 实例，指定检查点应保存在何处以及在何种条件下，并将其用作 Trainer() 工具中的“回调”参数，但在完成一个训练时期后（我可以看到完成并返回了一个 val_loss）它无法保存在我的位置，因为：

它正在显示atomic_save代码并尝试评估以下内容：

我已经看了一遍，这个特定的 AttributeError 似乎很不常见。我已经确保我的所有软件包都已更新。任何帮助表示赞赏。不确定我是否在这里遗漏了一些明显的东西。

python pytorch pytorch-lightning

2021-06-07T22:52:04.297

0 投票

1 回答

118 浏览

deep-learning - 使用 pytorch-lightning 实现 Network in Network CNN 模型

我正在尝试实现 NiN 模型。基本上试图从d2l复制代码这是我的代码。

运行代码后，我的准确度仅为 0.1。不知道我哪里出错了。我已经能够使用相同的模板实现其他 CNN（如 VGG）。不知道我哪里出错了。10 个 epoch 后准确率应该接近 0.9。

deep-learning pytorch pytorch-lightning

2021-06-10T21:13:00.810

0 投票

1 回答

41 浏览

pytorch - 来自 PyTorch 模型的 ONNX 对象，无需导出

是否可以在不导出的情况下将 PyTorch 模型转换为 ONNX，并在脚本中直接将其用作 ONNX 对象。

pytorch onnx pytorch-lightning onnxruntime onnx-coreml

2021-06-17T09:23:52.563

问题标签 [pytorch-lightning]

Reference