我正在尝试从上传的文本文件中获取前 1,000 个字符。我正在做:
if($file->simpletype=="document"){
//get first 1000 chars in here
$snippet = file_get_contents($_FILES['upload']['tmp_name'], false, null, -1, 1000);
file_put_contents('/var/www/my_logs/log.log', $snippet);
$file->snippet = $snippet;
}
这适用于 .txt 文件,我可以使用 gedit 打开和读取 log.log 文件。但是对于.doc、.docx、.odt和.pdf文件,file_get_contents()
返回乱码,例如:PK\00\00\00\
我尝试了在stackoverflow上找到的另一种解决方案:
function file_get_contents_utf8() {
$content = file_get_contents($_FILES['upload']['tmp_name'], false, null, -1, 1000);
return mb_convert_encoding($content, 'UTF-8',
mb_detect_encoding($content, 'UTF-8, ISO-8859-1', true));
}
但我得到相同的结果。有任何想法吗?谢谢!