我一直在阅读有关 PHP 文件上传安全性的文章,一些文章建议重命名文件。例如,OWASP 文章Unrestricted File Upload 说:
建议使用算法来确定文件名。例如,文件名可以是文件名加上日期的 MD5 哈希值。
如果用户上传一个名为的文件Cake Recipe.doc
,是否真的有任何理由将其重命名为45706365b7d5b1f35
?
如果答案是肯定的,无论出于何种原因,那么您如何跟踪原始文件名和扩展名?
我一直在阅读有关 PHP 文件上传安全性的文章,一些文章建议重命名文件。例如,OWASP 文章Unrestricted File Upload 说:
建议使用算法来确定文件名。例如,文件名可以是文件名加上日期的 MD5 哈希值。
如果用户上传一个名为的文件Cake Recipe.doc
,是否真的有任何理由将其重命名为45706365b7d5b1f35
?
如果答案是肯定的,无论出于何种原因,那么您如何跟踪原始文件名和扩展名?
对于您的主要问题,重命名文件是否是一种好习惯,答案是肯定的,特别是如果您正在创建一种文件存储库形式,用户可以在其中上传他们选择的文件(和文件名),原因如下:
Cake Recipe.doc
不是 URL 安全名称,并且在某些系统(服务器或浏览器端)/某些情况下,当名称应该是urlencode
d 值时会导致不一致。 至于存储信息,您通常会在数据库中执行此操作,这与您已经拥有的需求没有什么不同,因为您需要一种方法来引用文件(上传者,名称是什么,有时存储位置,上传时间,有时是大小)。除了文件的用户名之外,您只需将文件的实际存储名称添加到该文件中。
OWASP 的建议也不错——使用文件名和时间戳(不是日期)大部分都是唯一的。我更进一步,包括带有时间戳的微时间,通常还有一些其他独特的信息,这样小文件的重复上传就不会在同一时间范围内发生——我还存储了上传的日期这是针对 md5 冲突的额外保险,这在存储许多文件和多年的系统中具有更高的概率。您不太可能在同一天使用文件名和微时间生成两个类似 md5 的文件。一个例子是:
$filename = date('Ymd') . '_' . md5($uploaded_filename . microtime());
我的 2 美分。
当我上传文件时,我对存储在服务器上的文件名使用 PHP 的 unique_id() 函数(并且我保留了文件扩展名,因为它使我在通过本地文件查看存储目录中的所有文件时更容易系统)。
我将文件保存在网站文件系统之外(也就是说,您永远无法直接浏览文件)。
我总是使用 php 的 move_uploaded_file() 函数将文件保存到服务器。
我将原始文件名、存储它的路径/文件名以及您可能需要的关于谁上传它的任何其他项目相关信息等存储在数据库中。
在我的一些实现中,我还创建了文件内容的哈希并将其保存在数据库中。然后与其他上传的文件一起查看数据库,看看我是否已经存储了该文件的副本。
一些代码示例:
表格:
form method="post" enctype="multipart/form-data" action="your_form_handler.php">
<input type="file" name="file1" value="" />
<input type="submit" name="b1" value="Upload File" />
</form>
表单处理程序:
<?php
// pass the file input name used in the form and any other pertinent info to store in the db, username in this example
_process_uploaded_file('file1', 'jsmith');
exit;
function _process_uploaded_file($file_key, $username='guest'){
if(array_key_exists($file_key, $_FILES)){
$file = $_FILES[$file_key];
if($file['size'] > 0){
$data_storage_path = '/path/to/file/storage/directory/';
$original_filename = $file['name'];
$file_basename = substr($original_filename, 0, strripos($original_filename, '.')); // strip extention
$file_ext = substr($original_filename, strripos($original_filename, '.'));
$file_md5_hash = md5_file($file['tmp_name']);
$stored_filename = uniqid();
$stored_filename .= $file_ext;
if(! move_uploaded_file($file['tmp_name'], $data_storage_path.$stored_filename)){
// unable to move, check error_log for details
return 0;
}
// insert a record into your db using your own mechanism ...
// $statement = "INSERT into yourtable (original_filename, stored_filename, file_md5_hash, username, activity_date) VALUES (?, ?, ?, ?, NOW())";
// success, all done
return 1;
}
}
return 0;
}
?>
处理下载请求的程序
<?php
// Do all neccessary security checks etc to make sure the user is allowed to download the file, etc..
//
$file = '/path/to/your/storage/directory' . 'the_stored_filename';
$filesize = filesize($file);
header('Content-Description: File Transfer');
header("Content-type: application/forcedownload");
header("Content-disposition: attachment; filename=\"filename_to_display.example\"");
header("Content-Transfer-Encoding: Binary");
header('Cache-Control: must-revalidate, post-check=0, pre-check=0');
header('Pragma: public');
header("Content-length: ".$filesize);
ob_clean();
flush();
readfile("$file");
exit;
如果您想在用户请求下载的同一页面中显示下载内容,请查看我对这篇文章的回答: Dowloading multiple PDF files from javascript
您需要重命名上传的文件是有充分理由的,如果两个上传相同的文件或同名的文件,后一个文件将替换前一个文件,这是不利的。
您可以使用散列算法,例如
$extensions = explode(".",$file-name);
$ext = $extensions[count($extensions)-1];
$file-name = md5($file-name .$_SERVER['REMOTE_ADDR']) .'.' .$ext;
然后您可以保存文件名、散列文件名、上传者详细信息、日期、时间的详细信息以跟踪文件