问题标签 [mxnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 通过 R 中的 MXNet 进行时间序列预测的 LSTM 示例
有人知道我在哪里可以找到通过 MXNet(R 包)的 LSTM 示例吗?基本任务是通过 x[1 ... t] 序列预测 x[t + 1] 值。
deep-learning - 多任务学习网络结构设计
我正在尝试使用 CNN 进行文本分类。这是我的一些标签:dog
, cat
, bird
, football
, basketball
... 由于这些类在某种程度上过于细粒度而无法获得良好的精度,再加上训练数据量相对较少,因此我将它们分组为animal
, sports
。
然后我设计了一个简单的多任务学习结构,如下所示,但它并没有提高我细粒度标签的最终性能。
我还尝试通过SoftmaxActivation
在之后添加内部层来合并更多信息fc
,但没有奏效:
那么你们对设计这样的网络有什么想法或经验吗?欢迎大家提出意见,谢谢~
deep-learning - 如何使用 mxnet RNN 符号生成 lstm
我发现在 mxnet v0.7 python lib 中添加了 RNN 符号。现在,我正在尝试使用它在示例/rnn 中使用 python 实现 lstm。但我不知道,因为没有文件或输入和输出的任何信息。谁能给我任何建议?谢谢
python - Python KMax 池化 (MXNet)
我正在尝试在本文中重新创建 char 级 CNN,但在需要创建 k-max 池化层的最后一步有点卡住,因为我使用的是 MXNet,但它没有这个。
一个重要的区别还在于引入了多个时间 k-max 池化层。这允许检测句子中最重要的 k 个特征,独立于它们的特定位置,保持它们的相对顺序。
然而,MXNet 确实有能力添加一个新的操作,我一直在尝试这样做(尽管对数据的形状、给定的过滤器和批量大小有点困惑)。
传入数据的形状:
出来的数据的形状(k-max pooling,k = 7):
到目前为止我的想法......:
但是,我不确定几件事:
- 如何测试这是否有效(一旦我有一些完整的代码)
- 尺寸应该是多少?我正在对最后一个维度进行排序(轴 = 0)
- 对backward()函数做什么,即梯度传播
- 这是否适用于 GPU - 我猜我将不得不用 C/cuda 重写它?
我为 keras 的其他人找到了这个示例(但没有代表链接):
python - 初始 - mxnet 模型
我是图像分类的新手。我正在尝试在 python 中使用 mxnet 解决 kaggle 上的问题。我试图运行一个脚本代码,这是该问题的解决方案之一。代码就像:
它显示错误:
MXNetError:[15:23:58] src/io/local_filesys.cc:149:检查失败:allow_null LocalFileSystem:无法打开“/Inception/Inception-7-symbol.json”
我什至更改了“前缀”中的路径,例如:
但我仍然不明白为什么它没有打开.json
文件并显示错误。我正在使用 Ubuntu 16.04。
python - 重塑 OpenCV 图像(numpy)尺寸
我需要将通过 cv2 加载的 numpy 数组中的图像转换为其卷积层的深度学习库 mxnet 的正确格式。
我当前的图像形状如下:(256、256、3)或(高度、宽度、通道)。
据我所知,这实际上需要是(3、256、256)或(通道、高度、宽度)。
不幸的是,我对 numpy/python opencv 的了解还不足以知道如何正确操作数组。
我发现我可以通过 cv2.split 将数组拆分为通道,但我不确定如何以正确的格式再次组合它们(我不知道使用 cv2.split 是否是最佳的,或者是否有是 numpy 中更好的方法)。
谢谢你的帮助。
python - 绑定错误的上下文时,mxnet 不会引发错误
我希望确切地看到我的 mxnet 程序正在运行哪个 cpu 或 gpu,所以我在executor.pyprint self._ctx
的源代码中添加了一个。然后我将执行器与 gup(10) 绑定,但没有引发错误,因为我的计算机中只有一个 gpu。有人可以解释一下吗?
r - MXNET 可以在 R 中拟合回归 LSTM 模型吗?
我想在 R 中使用 MXNET 拟合 LSTM 模型,以便在给定几个连续预测变量的情况下预测连续响应(即回归)。但是,mx.lstm() 函数似乎面向 NLP,因为它需要似乎不适用于回归问题的参数(例如与嵌入相关的参数)。
MXNET 是否能够进行这种建模,如果没有,什么是合适工具的示例(最好在 R 中)?是否有与我描述的问题相关的教程?
python-2.7 - 在 Python 上使用 Mxnet 库运行深度学习图像分类示例时出错
我正在尝试运行这个图像分类示例,该示例在 python中使用Mxnet 库和预训练的深度学习模型 Inception-BN。此行的执行抛出和错误:prob = model.predict(batch)[0]
带有错误消息:
我尝试再次下载 Inception-BN 模型以确保它是最新的,但并没有什么不同。我确实怀疑问题可能出在网上:由于我的服务器没有配备gpu model = mx.model.FeedForward.load(prefix, num_round, ctx=mx.gpu(), numpy_batch_size=1)
,因此我不得不将gpu更改为cpu 。然而,错误似乎并没有指向那个方向。
知道如何解决吗?除了性能较低之外,使用 cpu 代替 gpu 是否存在问题?
最后是完整的错误信息:
scala - 如何解释这个scala语法“Class [_ >:Float with Int with Double]”
当我阅读 Mxnet 源代码时,我对以下语句感到困惑:
“Class[_ >: Float with Int with Double], Int]”是什么意思?我了解在类声明期间可以使用 scala 关键字“with”,例如
表示“人”类具有对象“玻璃”的特征。
如何解释上面代码中“with”的用法?