我正在从事一个项目,其中我的图像文件格式错误(模糊,即它们的图像数据已被更改)。这些文件在各种平台上呈现时会导致来自平台的警告/崩溃/通过报告。
我正在尝试使用无监督机器学习构建一个防护罩,这将帮助我将这些图像识别/分类为恶意或非恶意图像。我有这些文件的二进制数据,但我不知道我可以从中识别出哪些特征集/模式,因为从视觉上看,这些图像可能是任何东西。(我需要能够从二进制数据中找到特征集)
我需要一些关于我可以用来从这个二进制数据中自动提取特征的工具/方法的建议;我可以将其与无监督学习算法(例如 Kohenen 的 SOM 等)一起使用的功能集。
我是新手,任何帮助都会很棒!