问题标签 [pytorch]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5365 浏览

loss - 关于 torch.nn.CrossEntropyLoss 参数形状

我正在学习 pytorch,并参加基于 tensorflow 的 anpr项目 https://github.com/matthewearl/deep-anpr,http://matthewearl.github.io/2016/05/06/cnn-anpr / ) 作为练习,移植到pytorch平台。

有一个问题,我使用 nn.CrossEntropyLoss() 作为损失函数:

模型的 output.data 是:

和targets.data是:

当我打电话时:

发生错误,信息是:

调用 loss=criterion(output,targets),错误是:

我最后一个练习是mnist,一个pytorch的例子,我做了一点修改,batch_size是4,损失函数:

输出数据:

标签.数据:

标签,对于输入图像,必须是单个元素,在上例中,有 253 个数字,而在 'mnist' 中,只有一个数字,输出的形状与标签不同。

我查看了 tensorflow 手册 tf.nn.softmax_cross_entropy_with_logits,“Logits 和标签必须具有相同的形状 [batch_size, num_classes] 和相同的 dtype(float32 或 float64)。”

pytorch 是否支持 tensorflow 中的相同功能?

很多想法

0 投票
1 回答
1768 浏览

classification - OSError:无法识别图像文件

我正在尝试 pytorch 中的 impelement 代码,但出现以下错误。我的 python 版本是 3.6,我的操作系统是 linux ubuntu 16.04 lts。我在 mac os 旁边安装了我的 linux。我们将使用 torchvision 和 torch.utils.data 包来加载数据。每个类有 75 个验证图像。

我的代码如下:

0 投票
3 回答
9780 浏览

python - 尝试在 Pytorch 中加载自定义数据集

我刚开始使用 PyTorch,不幸的是,在将我自己的训练/测试图像数据集用于自定义算法时,我有点困惑。首先,我正在制作一个小型的“hello world”式卷积衬衫/袜子/裤子分类网络。我只加载了一些图像,只是确保 PyTorch 可以加载它们并将它们正确转换为 32x32 可用图像。我的 ImageFolder 设置如下:

图像/袜子/袜子图像.jpeg
图像/裤子/裤子图像.jpeg
图像/衬衫/衬衫图像.jpeg

以及我的测试图像文件夹的类似设置。根据我目前的知识,PyTorch 中内置的图像加载器应该从训练/测试图像中的子文件夹名称中读取标签。但是,我TypeError抱怨说我的迭代器不可迭代。这是我的代码和错误:

错误:

它说它是对包含行的引用dataiter.next(),这意味着编译器认为我不能迭代dataiter

请帮忙!提前致谢,

-David Sillman,PyTorch 新手

0 投票
4 回答
23744 浏览

neural-network - Pytorch,什么是梯度参数

我正在阅读 PyTorch 的文档,并找到了他们编写的示例

其中 x 是一个初始变量,从中构造了 y(一个 3 向量)。问题是,梯度张量的 0.1、1.0 和 0.0001 参数是什么?文档对此不是很清楚。

0 投票
1 回答
4718 浏览

python - 使用 PyTorch 生成 LSTM 时间序列

几天来,我正在尝试使用 LSTM 构建一个简单的正弦波序列生成,但到目前为止还没有看到任何成功。

我从时序预测例子开始

我想做的所有不同的是:

  • 使用与 LBFGS 不同的优化器(例如 RMSprob)
  • 尝试不同的信号(更多的正弦波分量)

这是我的代码的链接。“experiment.py”是主文件

我要做的是:

  • 我生成人工时间序列数据(正弦波)
  • 我将那些时间序列数据切割成小序列
  • 我的模型的输入是时间序列 0...T,输出是时间序列 1...T+1

会发生什么:

  • 训练和验证损失平稳下降
  • 测试损耗非常低
  • 但是,当我尝试从种子(来自测试数据的随机序列)开始生成任意长度的序列时,一切都出错了。输出总是平坦的

生成信号的形状

我根本不明白问题是什么。我现在正在玩这个一周,看不到任何进展。如果有任何帮助,我将不胜感激。

谢谢

0 投票
1 回答
2261 浏览

pytorch - PyTorch 中的默认膨胀值

正如 PyTorch 的文档中给出的那样,Conv2d 层使用默认膨胀 1。这是否意味着如果我想创建一个简单的 conv2d 层,我必须编写

而不是简单地写

还是在 PyTorch 中dilation = 1意味着与dilated Convolution部分中给出dilation = 0相同?

0 投票
1 回答
2602 浏览

tensorflow - 如何训练反向嵌入,如 vec2word?

你如何训练神经网络从向量表示映射到一个热向量?我感兴趣的例子是向量表示是word2vec嵌入的输出,我想映射到用于训练嵌入的语言中的各个单词,所以我猜这是vec2word

更详细一点;如果我理解正确,嵌入空间中的一组点代表相似的词。因此,如果您从该集群中的点进行采样,并将其用作 的输入vec2word,那么输出应该是到相似单个单词的映射?

我想我可以做一些类似于编码器 - 解码器的事情,但它必须那么复杂/使用这么多参数吗?

有这个TensorFlow教程,如何训练word2vec,但我找不到任何帮助来做相反的事情?我很高兴使用任何深度学习库来做这件事,并且可以使用采样/概率来做。

非常感谢您的帮助,阿杰。

0 投票
1 回答
1362 浏览

python - 在某些应用程序上禁用 GPU

我试图在 Nvidia GPU 上训练一些神经网络,但桌面环境(KDE)似乎占用了 GPU:

这是我正在运行的python代码:

错误:

如何禁止那些与 kde 相关的进程使用 GPU,而让它们使用 Intel 显卡?

0 投票
1 回答
5383 浏览

pytorch - 使用 pytorch 进行多变量线性回归

我正在研究 Pytorch 的线性回归问题。
我在单变量情况下取得了成功,但是当我执行多变量线性回归时,出现以下错误。我应该如何使用多个变量执行线性回归?

TypeError Traceback (last last call last) in () 9 optimizer.zero_grad() #gradient 10 outputs = model(inputs) #output ---> 11 loss = criteria(outputs,targets) #loss function 12 loss.backward() #backward propogation 13 optimizer.step() #1-step optimization(gradeint descent)

/anaconda/envs/tensorflow/lib/python3.6/site-packages/torch/nn/modules/module.py in call (self, *input, **kwargs) 204 205 def call (self, *input, ** kwargs): --> 206 result = self.forward(*input, **kwargs) 207 for hook in self._forward_hooks.values(): 208 hook_result = hook(self, input, result)

/anaconda/envs/tensorflow/lib/python3.6/site-packages/torch/nn/modules/loss.py in forward(self, input, target) 22 _assert_no_grad(target) 23 backend_fn = getattr(self._backend, type (self) .name) ---> 24 return backend_fn( self.size_average )(input, target) 25 26

/anaconda/envs/tensorflow/lib/python3.6/site-packages/torch/nn/_functions/thnn/auto.py in forward(self, input, target) 39 output = input.new(1) 40 getattr(self ._backend, update_output.name)(self._backend.library_state, input, target, ---> 41 output, *self.additional_args) 42 return output 43

TypeError:FloatMSECriterion_updateOutput 收到无效的参数组合 - 得到(int,torch.FloatTensor,torch.DoubleTensor,torch.FloatTensor,bool),但预期(int state,torch.FloatTensor 输入,torch.FloatTensor 目标,torch.FloatTensor 输出,布尔大小平均)

这是代码

0 投票
2 回答
1763 浏览

python - IOError:[Errno 28] 安装 pytorch 时设备上没有剩余空间

安装pytorch时出现如下错误

以下错误

怎么了 ?我不明白错误来自/python2.7/dist-packages/pip/