10

我正在尝试将本地化的货币字符串解析为货币和浮点值。

一段时间内一切正常,现在我们遇到了一些问题。似乎 NumberFormatter::parseCurrency 使用了一个额外的不可见字符:

测试代码:

<?php
$formatter = new NumberFormatter("de_DE", NumberFormatter::CURRENCY);
var_dump(array(
    $formatter->parseCurrency("88,22 €", $curr), // taken from output of $formatter->format(88.22)
    $formatter->parseCurrency("88,22 €", $curr), // input with keyboard
    $formatter->parseCurrency("88,22 \xE2\x82\xAc", $curr), // just a test
    $formatter->format(88.22),
    "88,22 €" // keyboard input
));

输出:

array(5) {
  [0]=> float(88,22)
  [1]=> bool(false)
  [2]=> bool(false)
  [3]=> string(10) "88,22 €" // this as input works
  [4]=> string(9) "88,22 €" // this not...
}

如您所见,输出 3 和 4 的字符串长度存在差异。

我在 PHP 5.3(启用了 mbstring 的 ubuntu)和 5.4(Mac OS X 上的 Zend Server)中得到了相同的结果。

主要问题是,来自我的表单(ZF1 应用程序)的输入值与索引 4 的输出相同......

有什么建议么?提前致谢

编辑1:

工作值的十六进制转储:

00000000  38 38 2c 32 32 c2 a0 e2  82 ac 0a                 |88,22......|
0000000b

非工作值的十六进制转储:

00000000  38 38 2c 32 32 20 e2 82  ac 0a                    |88,22 ....|
0000000a

编辑2:

使用的whitepsace似乎有问题。c2 a0 是 NO-BREAK SPACE 并且(也许?) NumberFormatter::parseCurrency() 需要。但 0x20 是默认空间(在输入表单中输入)。当前的解决方法是用 NO-BREAK SPACE 替换空格$value = str_replace("\x20", "\xC2\xA0", $value);

编辑3:

在另一个系统上(带有 Zend Server 5.6 的 Mac OS X,启用了 mbstring,PHP 5.3.14)一切都按预期工作:

array(5) {
  [0]=> float(88,22)
  [1]=> float(88,22)
  [2]=> float(88,22)
  [3]=> string(9) "88,22 €"
  [4]=> string(9) "88,22 €"
}

编辑4:

使用空间和使用非中断空间配置之间的主要区别在于 ICU 版本:

工作版本:

intl

Internationalization support => enabled
version => 1.1.0
ICU version => 3.8.1

Directive => Local Value => Master Value
intl.default_locale => no value => no value
intl.error_level => 0 => 0

不工作版本:

intl

Internationalization support => enabled
version => 1.1.0
ICU version => 4.8.1.1
ICU Data version => 4.8.1

Directive => Local Value => Master Value
intl.default_locale => no value => no value
intl.error_level => 0 => 0
4

1 回答 1

3

NumberFormatter::parseCurrency是 ICU 库函数的一个薄包装器unum_parseDoubleCurrency参见源代码)。

ICU 库函数具有限制性,因为它只会解析由其双重函数产生的字符串unum_formatDoubleCurrency。该格式由 Unicode 语言环境数据驱动,该数据指定货币值和数值之间的不间断空格。显然,该库的早期版本接受了其他空白字符。

简而言之,你不能NumberFormatter::parseCurrency接受空格。但是,Zend_Currency默认情况下也应该输出不间断的空格:

$currency = new Zend_Currency(array(
     'currency' => 'EUR',
     'value'    => 88.22,
), 'de_DE');

var_dump(
    strval($currency),             // 88,22 €
    strpos($currency, "\x20"),     // false
    strpos($currency, "\xc2\xa0")  // 5
);

问题是您的应用程序的哪一部分正在输出空间以及您如何处理它。您提到它是您表单的一部分,所以也许您可以考虑让表单将货币和值作为单独的字段返回,这样您就不必担心解析数字。如果用户自己输入字符串“88,22 €”,您可能会遇到更多问题,而不仅仅是空格问题。话虽如此,\x20如果\xc2\xa0您想使用NumberFormatter.

于 2013-05-12T16:07:51.850 回答