我是机器学习和人工智能的新手,最近开始接触 NN。
已经在这里获得了一些关于 stackoverflow 的信息,但我目前不了解整个收集到的信息的逻辑。
让我们取 4 个标称(但不是序数)值 [A、B、C、D] 和 2 个已经标准化的数值 [0.35, 0.55] - 所以 2 个输入神经元,一个用于标称,一个用于数值。我主要在 NN 文献中看到您必须使用 4 个输入神经元进行编码。但我不需要它来预测那些名义上的。如果我将它与专家系统和规则一起使用,我只有一个输出神经元最多代表一种关系。
例如,如果我将它们归一化为 [0.2, 0.4, 0.6, 0.8],NN 不能区分它们吗?对于 NN,它只是一个数字,不是吗?
天真的方法和思维:
A with 0.35 numerical leads to ideal 1.
B with 0.55 numerical leads to ideal 0.
C with 0.35 numerical leads to ideal 0.
D with 0.55 numerical leads to ideal 1.
我对这种方法的思考方式是否有错误?
附加信息(编辑):这些标称值包含在决策中(如果使用统计工具通过结合数值来衡量,则意义重大),取决于它们是否为真。我知道它们可以被编码为二进制,但标称值的列表有点大。
其他示例:
验血 1 的症状 A 导致诊断 X(理想) 验血 1 的症状 B 导致诊断 Y(理想)
实际上使用了专家系统。症状是标称值,但结合验血值可以得到诊断。最后的主要问题是:我必须以二进制方式对症状进行编码还是可以用数字替换症状?如果我不能用数字代替它,为什么二进制表示是使用 NN 的唯一方法?