我正在尝试使用 php 创建一个 CSV 文件。如何打印非 ascii 字符?
7 回答
可以在 CSV 文件中使用 unicode 字符,只需确保使用正确的 HTTP 标头即可。这在 OpenOffice 中效果很好,但如果我没记错的话,Excel 在显示带有 unicode 字符的 CSV 文件时会遇到一些问题。
此外,您应该尝试使用fputcsv,它使事情变得更容易。当您动态创建文件时,您可以使用php 输出流。
所以是这样的:
$handle = fopen("php://output", "w");
header("Content-Type: text/csv; charset=UTF-8");
fputcsv($handle, $fields, ';', '"');
fclose($handle);
编辑
阅读您的评论后,您似乎在转换 .html 等 htmlentities 时遇到问题é
。要转换这些实体,您必须确保每个字段都已解码。您可以使用html_entity_decode来执行此操作,如下所示:
$decoded_string = html_entity_decode($string, ENT_QUOTES, 'UTF-8');
顺便说一句,在大多数情况下,将带有 htmlentities 的文本存储在数据库中并不是一个好主意,因为当您不想输出 html(如本例中)时,您必须将它们转换回真实字符。将文本存储为 unicode 更容易。
fputcsv应该处理 utf-8。
这是我使用的,我相信它可以针对您的情况进行一些改进,但总体而言非常通用并且对许多情况非常有用。
您只需为您的 sql 提供函数,它就会吐出一个带有列名标题行的 csv。
<?php
function exportMysqlToCsv($csvsql,$filename = 'export.csv')
{
$csv_terminated = "\n";
$csv_separator = ",";
$csv_enclosed = '"';
$csv_escaped = "\\";
$sql_query = $csvsql;
// Gets the data from the database
$result = mysql_query($sql_query);
$fields_cnt = mysql_num_fields($result);
$schema_insert = '';
for ($i = 0; $i < $fields_cnt; $i++)
{
$l = $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed,
stripslashes(mysql_field_name($result, $i))) . $csv_enclosed;
$schema_insert .= $l;
$schema_insert .= $csv_separator;
} // end for
$out = trim(substr($schema_insert, 0, -1));
$out .= $csv_terminated;
// Format the data
while ($row = mysql_fetch_array($result))
{
$schema_insert = '';
for ($j = 0; $j < $fields_cnt; $j++)
{
if ($row[$j] == '0' || $row[$j] != '')
{
if ($csv_enclosed == '')
{
$schema_insert .= $row[$j];
} else
{
$meta = mysql_fetch_field($result, $j);
if($meta->type == "int" || $meta->type == "real")
{
$schema_insert .= $row[$j];
} else {
$schema_insert .= $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed, $row[$j]) . $csv_enclosed;
}
}
} else
{
$schema_insert .= '';
}
if ($j < $fields_cnt - 1)
{
$schema_insert .= $csv_separator;
}
} // end for
$out .= $schema_insert;
$out .= $csv_terminated;
} // end while
header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
header("Content-Length: " . strlen($out));
// Output to browser with appropriate mime type, you choose ;)
header("Content-type: text/x-csv");
//header("Content-type: text/csv");
//header("Content-type: application/csv");
header("Content-Disposition: attachment; filename=$filename");
echo $out;
exit;
}
?>
正如您所说,它们是即时生成的(即您正在使用echo
etc 直接输出它们),那么以下内容将有所帮助:
1) 在 PHP 代码的最开头添加此标头:
header ('Content-type: text/csv; charset=utf-8');
2) 在 HTML 代码中添加此元:
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
3) 将您的 PHP 代码文件保存为UTF-8 不带 BOM。
当您选择网页的页面信息时,请检查文件编码是什么。它应该是 UTF-8。如果不是,则您输出的数据不是 UTF。
还请您的浏览器设置了什么字符编码。在 Firefox 中,它位于 menu->view->character encoding 中。
实际上 shamittomar 的回答非常好,但它错过了一件事
您的问题与您的编码有关
您应该将文本编码转换为 UTF-8,因为 php 在内部使用 ascii
例子 :
$str = mb_convert_encoding($str , "UTF-8") ;
更多信息请访问 php.net
我发现的最好的例子就是这个。
function str_to_csv($row) {
if ($row == '') {
return array();
}
$a = array();
$src = explode(',', $row);
do {
$p = array_shift($src);
while (mb_substr_count($p, '"') % 2 != 0) {
if (count($src) == 0) {
return false;
}
$p .= ',' . array_shift($src);
}
$match = null;
if (preg_match('/^"(.+)"[\r\n]*$/', $p, $match)) {
$p = $match[1];
}
$a[] = str_replace('""', '"', $p);
} while (count($src) > 0);
return $a;
}
function file_getcsv($f) {
$line = fgets($f);
while (($a = str_to_csv($line)) === false) {
if (feof($f)) {
return false;
}
$line .= "\n" . fgets($f);
}
return $a;
}
function file_to_csv($filename) {
ini_set("auto_detect_line_endings", true);
$a = array();
$f = fopen($filename, 'r');
while (!feof($f)) {
$rec = file_getcsv($f);
if ($rec === false) {
return false;
}
if (!empty($rec)) {
$a[] = $rec;
}
}
fclose($f);
return $a;
}
$data = file_to_csv('base2.csv');
echo '<pre>';
print_r($data);