我在网上找到了一个函数,它使用常规表达式来迭代字符串并在指定数量的字符后插入换行符,因此它将适合具有固定宽度的窄表格单元格。这是功能:
/**
* wordwrap for utf8 encoded strings
*
* @param string $str
* @param integer $len
* @param string $what
* @return string
* @author Milian Wolff <mail@milianw.de>
*/
function utf8_wordwrap($str, $width, $break, $cut = false) {
if (!$cut || $_SESSION['wordwrap']) {
$regexp = '#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){'.$width.'}#';
} else {
return $str; //if no wordwrap turned on, returns the original string
}
if (function_exists('mb_strlen')) {
$str_len = mb_strlen($str,'UTF-8');
} else {
$str_len = preg_match_all('/[\x00-\x7F\xC0-\xFD]/', $str, $var_empty);
}
$while_what = ceil($str_len / $width);
$i = 1;
$return = '';
while ($i < $while_what) {
preg_match($regexp, $str,$matches);
$string = $matches[0];
$return .= $string.$break;
$str = substr($str, strlen($string));
$i++;
}
return $return.$str;
}
这是正则表达式:
#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){20}#
如果它与 while 循环结合使用,直到字符串中出现换行符,它就可以很好地完成工作。
示例字符串:
1. first
2. second
3. third
prag_match 的输出:
array (
0 => '1. first
2. second
3',
)
所以它只计算第 20 个字符,并返回它。
我需要的是:让它返回所有内容,直到一个新行字符(\n)或者如果没有,返回前 20 个字符。所以这种情况下的输出将是这样的:
array (
0 => '1. first',
1 => '2. second',
2 => '3. third'
)
更新: 我尝试了史蒂夫罗宾斯的答案,它运行良好,直到字符串中有一些规范的 UTF-8 字符。这是我的错,我一开始没有提供一个像样的例子。这是它的作用:
<?php
header('Content-type: text/html; charset=UTF-8');
$input = '1. first
2. second
3. third
ez eg nyoulőűúúú3456789öüö987654323456789öü
pam
param';
$output = array();
foreach (explode("\n", $input) as $value) {
foreach (str_split($value, 20) as $v) {
$trimmed = trim($v);
if (!empty($trimmed))
$output[] = $trimmed;
}
}
var_dump($output);
输出是:
array(8) {
[0]=>
string(8) "1. first"
[1]=>
string(9) "2. second"
[2]=>
string(8) "3. third"
[3]=>
string(20) "ez eg nyoulőűúú�"
[4]=>
string(20) "�3456789öüö987654"
[5]=>
string(13) "323456789öü"
[6]=>
string(3) "pam"
[7]=>
string(5) "papam"
}