我有一个 csv 格式的大型(150000)数据集。数据集在某些领域存在一些噪音和错误。我想读取这个文件并使用 svm(with libsvm) 对其进行分类。我需要读取干净且可用的数据子集。选择 10000 个干净的随机记录,并且没有一个字段是嘈杂的。有噪声的文件的值为 0 或 NA。我怎样才能用matlab做到这一点?
问问题
290 次
我有一个 csv 格式的大型(150000)数据集。数据集在某些领域存在一些噪音和错误。我想读取这个文件并使用 svm(with libsvm) 对其进行分类。我需要读取干净且可用的数据子集。选择 10000 个干净的随机记录,并且没有一个字段是嘈杂的。有噪声的文件的值为 0 或 NA。我怎样才能用matlab做到这一点?