3

这是扩展问题:帮助对二进制文件格式进行逆向工程的工具

是否有任何公开可用的工具使用集群和/或数据挖掘技术对文件格式进行逆向工程?

例如,使用该工具,您将拥有一组具有相同格式的文件,并且该工具的输出将是通用结构?

4

1 回答 1

6

如果一个人有一种真正有效的二进制编码格式(ZIP 文件就是一个例子),那么每一位的信息内容就很高。本质上,它看起来像一个完美的随机数。

如果没有额外的知识,你无法从中推断出任何东西。

如果二进制编码效率不高,理论上,你有一些微弱的机会看到结构。但这听起来仍然很难;你是如何开始猜测字段的边界在哪里的?

人工智能机器学习类型会告诉你,除非你已经“几乎”知道,否则你什么也学不到。他们通常通过使用至少您可以推理的问题标记对问题进行编码来成功。

如果不提供更多信息,我认为您无法做到这一点。你对文件格式有什么了解吗?字段大小总是小于 N 位?只有 ASCII 字符串被编码,反之亦然?

于 2009-12-04T23:42:44.053 回答