9

我一直在阅读有关 PHP 文件上传安全性的文章,一些文章建议重命名文件。例如,OWASP 文章Unrestricted File Upload 说:

建议使用算法来确定文件名。例如,文件名可以是文件名加上日期的 MD5 哈希值。

如果用户上传一个名为的文件Cake Recipe.doc,是否真的有任何理由将其重命名为45706365b7d5b1f35?

如果答案是肯定的,无论出于何种原因,那么您如何跟踪原始文件名和扩展名?

4

3 回答 3

20

对于您的主要问题,重命名文件是否是一种好习惯,答案是肯定的,特别是如果您正在创建一种文件存储库形式,用户可以在其中上传他们选择的文件(和文件名),原因如下:

  1. 安全性——如果你的应用程序写得不好,它允许通过名称或直接访问来下载文件(这很可怕,但它确实发生了),无论是恶意还是故意,用户都很难“猜测”名称的文件。
  2. 唯一性——两个不同的人上传同名文件的可能性非常高(即 avatar.gif、readme.txt、video.avi 等)。使用唯一标识符显着降低了两个文件同名的可能性。
  3. 版本控制——使用唯一名称保存文档的多个“版本”要容易得多。它还避免了需要额外的代码来解析文件名以进行更改。一个简单的例子是 document.pdf 到 document(1).pdf,当你不低估用户为事物创建可怕名称的能力时,它会变得更加复杂。
  4. 长度——使用已知文件名长度总是比使用未知文件名长度更好。我总是可以知道(我的文件路径)+(X 字母)是一定的长度,其中(我的文件路径)+(随机用户文件名)是完全未知的。
  5. 操作系统——在尝试将极其随机/长的文件名写入驱动器时,上述长度也会产生问题。您必须考虑特殊字符、长度和修剪文件名的问题(用户可能不会收到工作文件,因为扩展名已被修剪)。
  6. 执行——操作系统很容易执行名为 .exe 或 .php 或(插入其他扩展名)的文件。没有扩展就很难。
  7. URL 编码——确保名称是 URL 安全的。Cake Recipe.doc不是 URL 安全名称,并且在某些系统(服务器或浏览器端)/某些情况下,当名称应该是urlencoded 值时会导致不一致。

至于存储信息,您通常会在数据库中执行此操作,这与您已经拥有的需求没有什么不同,因为您需要一种方法来引用文件(上传者,名称是什么,有时存储位置,上传时间,有时是大小)。除了文件的用户名之外,您只需将文件的实际存储名称添加到该文件中。

OWASP 的建议也不错——使用文件名和时间戳(不是日期)大部分都是唯一的。我更进一步,包括带有时间戳的微时间,通常还有一些其他独特的信息,这样小文件的重复上传就不会在同一时间范围内发生——我还存储了上传的日期这是针对 md5 冲突的额外保险,这在存储许多文件和多年的系统中具有更高的概率。您不太可能在同一天使用文件名和微时间生成两个类似 md5 的文件。一个例子是:

$filename = date('Ymd') . '_' . md5($uploaded_filename . microtime());

我的 2 美分。

于 2013-07-25T19:18:33.990 回答
3

当我上传文件时,我对存储在服务器上的文件名使用 PHP 的 unique_id() 函数(并且我保留了文件扩展名,因为它使我在通过本地文件查看存储目录中的所有文件时更容易系统)。

我将文件保存在网站文件系统之外(也就是说,您永远无法直接浏览文件)。

我总是使用 php 的 move_uploaded_file() 函数将文件保存到服务器。

我将原始文件名、存储它的路径/文件名以及您可能需要的关于谁上传它的任何其他项目相关信息等存储在数据库中。

在我的一些实现中,我还创建了文件内容的哈希并将其保存在数据库中。然后与其他上传的文件一起查看数据库,看看我是否已经存储了该文件的副本。

一些代码示例:

表格:

 form method="post" enctype="multipart/form-data" action="your_form_handler.php">



<input type="file" name="file1" value="" />



 <input type="submit" name="b1" value="Upload File" />

 </form>

表单处理程序:

 <?php

 // pass the file input name used in the form and any other pertinent info to store in the db, username in this example
_process_uploaded_file('file1', 'jsmith');

exit;



function _process_uploaded_file($file_key, $username='guest'){    
    if(array_key_exists($file_key, $_FILES)){
        $file = $_FILES[$file_key];
        if($file['size'] > 0){
            $data_storage_path = '/path/to/file/storage/directory/';
            $original_filename = $file['name'];
            $file_basename     = substr($original_filename, 0, strripos($original_filename, '.')); // strip extention
            $file_ext          = substr($original_filename, strripos($original_filename, '.'));
            $file_md5_hash     = md5_file($file['tmp_name']);
            $stored_filename   = uniqid();
            $stored_filename  .= $file_ext;                        
            if(! move_uploaded_file($file['tmp_name'], $data_storage_path.$stored_filename)){
                 // unable to move,  check error_log for details
                 return 0;
            }
            // insert a record into your db using your own mechanism ...
            // $statement = "INSERT into yourtable (original_filename, stored_filename, file_md5_hash, username, activity_date) VALUES (?, ?, ?, ?, NOW())";

            // success, all done
            return 1;
        }
    }    
    return 0;
}

?>

处理下载请求的程序

 <?php

    // Do all neccessary security checks etc to make sure the user is allowed to download the file, etc..

    // 

    $file = '/path/to/your/storage/directory' . 'the_stored_filename';
$filesize = filesize($file);
header('Content-Description: File Transfer');
header("Content-type: application/forcedownload");
header("Content-disposition: attachment; filename=\"filename_to_display.example\"");
header("Content-Transfer-Encoding: Binary");
header('Cache-Control: must-revalidate, post-check=0, pre-check=0');
header('Pragma: public');
header("Content-length: ".$filesize);
ob_clean();
flush();
readfile("$file");
exit;

如果您想在用户请求下载的同一页面中显示下载内容,请查看我对这篇文章的回答: Dowloading multiple PDF files from javascript

于 2013-07-25T18:55:33.967 回答
1

您需要重命名上传的文件是有充分理由的,如果两个上传相同的文件或同名的文件,后一个文件将替换前一个文件,这是不利的。

您可以使用散列算法,例如

$extensions =  explode(".",$file-name);
$ext = $extensions[count($extensions)-1]; 
$file-name = md5($file-name .$_SERVER['REMOTE_ADDR']) .'.' .$ext;

然后您可以保存文件名、散列文件名、上传者详细信息、日期、时间的详细信息以跟踪文件

于 2013-07-25T19:45:49.633 回答