我的教授要求我的班级制作一个神经网络来尝试预测乳腺癌是良性还是恶性。为此,我使用了Breast Cancer Wisconsin (Diagnostic) Data Set。
作为这样做的提示,我的教授说并非所有 30 个属性都需要用作输入(有 32 个,但前 2 个是 ID 和诊断),我想问的是:我应该如何接受这些30 个输入(这将创建 100+ 个权重,具体取决于我将使用多少个神经元)并将它们变成一个较小的数字?
我已经找到了如何“修剪”神经网络,但我认为这不是我想要的。我不是要消除不必要的神经元,而是要缩小输入本身。
PS:对不起,任何英语错误,这不是我的母语。