-5

我有以下 3 个“dataURL 图像”,如果您通过“URL”打开它们,它们都会返回相同的图像,但下面的两个 dataURL 代码最后嵌入了“PHP 代码”和“JavaScript 代码”。

如何从来自我不信任的用户的 base64 dataURL 图像中删除这些恶意代码。

base64 dataURL 图像(安全):



base64 dataURL 2 图片(PHP 代码注入):



base64 dataURL 3 图片(Javascript 代码注入):



您可以使用这些工具通过“在线解码”来查看文本代码 - https://www.base64decode.org/

我允许用户将图像上传到我的服务器,并将图像“转换为 base64 dataURL 图像”

从上面所有 3 个 base64 dataURL 图像中,您可以看到所有返回的图像都是相同的,但是由于图像中嵌入了文本代码,它们的 base64 代码不同。

我在后端使用 Go 来保存图像。我正在使用以下 HTML 代码将图像转换为 dataURL base64 文本。

<input type='file' onchange="readURL(this);" />
<img id="blah" src="#" alt="your image" />
<script>
function readURL(input) {
  if (input.files && input.files[0]) {
    var reader = new FileReader();
    reader.onload = function (e) {
      document.getElementById("blah").src = e.target.result;
    };
    reader.readAsDataURL(input.files[0]);
  }
}
</script>

我担心的是“文本”不应该在图像内,不应该在那里。

上面的 dataURL 返回相同的图像,但是由于内部有额外的数据,它们具有不同的 base64 代码。

我想从上面 2 个恶意代码中获取实际的图像 base64 代码。

假设,用户 B 上传的图像,我得到“base64 dataURL 3”图像,但我想从用户上传的图像中获取 base64 dataURL 原始图像。

如何做到这一点?

4

2 回答 2

3

ImageMagickconvert -strip <in> <out>会做到这一点。它还将删除其他无关数据(EXIF、嵌入式缩略图等),因此请确保该行为是您想要的。

$ xxd img.jpg | tail -n 3
00000280: 647f ffd9 3c73 6372 6970 743e 616c 6572  d...<script>aler
00000290: 7428 2768 656c 6c6f 2729 3b3c 2f73 6372  t('hello');</scr
000002a0: 6970 743e 0a                             ipt>.

$ convert -strip img.jpg img2.jpg

$ xxd img2.jpg | tail -n 3       
00000260: 383a 2ebd 4c00 32c8 1ba4 0064 6d3f 229f  8:..L.2....dm?".
00000270: 9001 90a7 e4c8 a1d3 eff9 0019 1800 0647  ...............G
00000280: ffd9

无论如何,如果您不尝试执行图像,则不会发生任何事情。但是,如果没有别的,那就是在您的图像文件中浪费空间。


要从 Go 执行此操作,请使用Go ImageMagick 绑定并调用StripImage

于 2019-08-08T21:31:28.463 回答
2

是的,在某个世界里,“用图片黑客”(通常称为 Stegosploits)是一回事。这里的行业方法是使用内容解除和重建(CDR) 软件。引用维基百科:

[CDR] 是一种计算机安全技术,用于从文件中删除潜在的恶意代码。与恶意软件分析不同,CDR 技术不会确定或检测恶意软件的功能,而是删除所有未在系统定义和策略中批准的文件组件。

如果这对您来说至关重要,您可能想研究一些可用的商业解决方案(本文还列出了其中的一些,我无法在此给出推荐)。

对于本土解决方案,重新编码图像可能就足够了。

于 2019-08-08T21:53:35.187 回答