我正在使用神经网络进行土壤光谱分类,我的教授从他的实验室获得了数据,其中包括从波长 1200 nm 到 2400 nm 的光谱反射率。他只有 270 个样本。
由于训练数据非常少(只有 270 个样本),我一直无法将网络训练的准确率超过 74%。我担心我的 Matlab 代码不正确,但是当我在 Matlab 中使用神经网络工具箱时,我得到了相同的结果……准确率不超过 75%。
当我和我的教授谈论这件事时,他说他没有更多的数据,但要求我对这些数据进行随机扰动以获得更多数据。我在网上对数据的随机扰动进行了研究,但结果不足。
有人可以指出我对 270 个数据样本执行随机扰动的正确方向,以便我可以获得更多数据吗?
另外,由于这样做,我将构建“假”数据,我看不出神经网络会变得更好,因为神经网络不是使用实际的真实有效数据来训练网络吗?
谢谢,
费萨尔。