问题标签 [cntk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ImportError:使用 VSCode 时无法导入名称“cntk_device”
我按照此链接中的说明将 VSCode 用于 cntk。
但是得到了这个错误:
在launch.json
和settings.json
文件中,我都有
在 中tasks.json
,我有:
我在配置中缺少什么?
cntk - 如何从小批量中检索序列 ID?
来自:https ://github.com/Microsoft/CNTK/wiki/CNTKTextFormat-Reader
“Sequence id 是一个数字。可以省略,这种情况下,行号将用作序列 id。”
假设我已经从这样的源创建了一个小批量:
地图文件:
代码:
如何从小批量中检索序列 ID?
cntk - 改进格式错误的输入格式的错误消息?
我有一个包含如下数据的地图文件:
使用以下代码将数据读入小批量:
如果输入文件格式不正确,您有时会收到一条非常神秘的错误消息。例如,输入文件最后一行末尾缺少换行符将导致如下错误:
有时可能很难确定文件中的哪个位置会出现问题。是否可以发出更具体的错误消息。输入文件中的行号会很有用。
python - 使用什么单位来定义 CNTK 的 epoch 大小?
如果我理解正确,在 CNTK Python API Trainer.previous_minibatch_sample_count 应该返回前一个小批量中的样本数(而不是序列)。我可以看到它在 LanguageUnderstanding 示例中按预期工作(即最后一个小批量中的样本数量确实接近使用的 minibatch_size):
然而,如果我修改(单独的)SequenceClassification 示例以使用 ProgressPrinter(唯一的更改),我会得到以下输出:
在上面的输出中,trainer (40-50) 报告的“样本数”远小于 minibatch_size (200)。我已经手动确认 Trainer 正在返回小批量中的 SEQUENCES 数量,而不是上述案例中的样本。
这是预期的吗?如果是这样,这里的逻辑是什么?
我可以看到一些教程/示例依赖于从 Trainer.previous_minibatch_sample_count 返回的值来确定 epoch 的结束......这是否总是可靠地工作?
python - CNTK:访问经过训练的模型数据
我已经使用 Python API 在 CNTK 中训练了一个模型。我想在 Android 设备上用代码实现网络。
有没有一种方法可以访问网络权重,然后在不使用 CNTK 库的情况下直接对网络进行编码?
我可以以人类可读的形式访问模型吗?
deep-learning - CNTK:序列到序列处理的损失函数
我正在为音素对齐做一个序列到序列的模型。具体来说,我的火车数据看起来像成对的序列(音素-长度),其中音素是一个单热向量,长度是一个浮点数。所以我想给模型输入一个音素序列,得到一个对应的长度序列。
我的网络通常是这样构建的:
如果我做对了,LinearLayer{1}
应该从 1 转换lstmDims
。因此,当我为模型提供长度为 N 的序列时,我也应该得到长度为 N 的结果序列。
现在我想设置一个合适的损失函数,我认为它应该是已知结果序列的元素与模型输出之间的平均差异。应该通过时间轴进行平均,以便可以管理不同长度的序列。
我打算做类似的事情
但在减少操作中明确指出
这些操作不支持对序列进行归约。相反,您可以通过重复来实现这一点。
我不确定如何为我的任务使用重复。而且我也不确定整个概念是否正常。
cntk - 将图像数据、行 ID 和标签合并到一个输入文件中?
我有这种格式的训练/测试输入文件(文件名标签):
上面的输入文件将与 ImageDeserializer 一起使用。由于在训练模型后我无法从代码中检索行 ID 和标签,因此我创建了第二个这种格式的测试文件:
第二个文件的格式与第一个文件中表示的信息相同,但格式不同。索引是行号,!piece_type 是以一种热格式编码的标签。我需要第二种格式的文件才能获得行号和标签。第二个文件与 CTFDeserializer 一起使用来创建一个复合阅读器,如下所示:
我添加第二个文件的原因是能够创建混淆矩阵,然后我需要能够同时拥有我测试的给定小批量的真实标签和预测标签。为了获得指向输入图像的指针包,行号很好。
是否有可能只用一个输入文件就可以做到这一点?处理多种文件和格式有点麻烦。
cntk - 如何获得复合 MinibatchSource 的流?
如果我像这样创建一个 MinibatchSource:
然后我可以像这样进入功能流:
但是,如果我这样创建 MiniBatchSource:
试试这个:
结果是:
我怎样才能进入功能流?
cntk - 如何在cntk中实现宽一维卷积
我想在 CNTK中实现宽类型的一维卷积( https://arxiv.org/pdf/1404.2188v1.pdf )。是否有内置方法或者我应该如何使用 Convolution() 的参数来实现它?
谢谢!
cntk - 如何在cntk中实现K-max pooling?
有人在 CNTK 中实现了 K-Max 池化吗?它是一个最大池化层,它不是从一些单元中选择顶部的一个,而是从前一层的所有单元中选择 k 个最大的输出。