抱歉这个相当简单的问题,但是关于微软开源人工智能库 CNTK 的使用的文档太少了。
我继续目睹人们将阅读器的特征从 1 开始,而将标签从 0 开始。但是它们都应该始终为 0,就像计算机科学中的信息总是从零开始吗?这样我们不会丢失一条信息吗?
CIFAR10 02_BatchNormConv 示例
features=[
#dimension = 3 (rgb) * 32 (width) * 32(length)
dim=3072
start=1
]
labels=[
dim=1
start=0
labelDim=10
labelMappingFile=$DataDir$/labelsmap.txt
]
更新:新格式
Microsoft 最近对此进行了更新,以消除这些混淆并使 CNTK 定义语言更具可读性。
您现在可以简单地在数据集中定义数据类型,而不必在行中定义值的开始:
|labels <tab seperated values> | features <tab seperated values> [EndOfLine/EOL]
如果你想颠倒特征和标签的顺序,你可以简单地去:
|features <tab seperated values> | labels <tab seperated values> [EndOfLine/EOL]
您只需要定义 dim 值,即可指定要输入的值的数量。
注意:没有| 在行的末尾。EOL 表示行的结束。