1

我知道 Lua 并不完全支持 unicode,但是应该有一个解决方法来解决这个问题?string.reverse 不适用于 unicode,因此以下示例将不起作用

  print(string.reverse("أحمد"))

有什么帮助吗?

4

1 回答 1

5

Corona SDK 似乎使用 UTF-8 作为编码。

如果要反转字符串中的所有 Unicode代码点,而不是所有字节,可以使用该代码:

function utf8reverse(str)
  return str:gsub("([\194-\244][\128-\191]+)", string.reverse):reverse()
end

print(utf8reverse("أحمد"))

诀窍如下:多字节 Unicode 代码点始终以字节11xx xxxx开头,后跟一个或多个字节10xx xxxx。第一步是反转每个多字节代码点上的所有字节,然后反转所有字节。

注意:当一个 Unicode 字符由多个代码点组成时,这个简单的技巧将不起作用。完整的支持需要一个大型的 Unicode 数据库来处理。

于 2012-10-28T19:46:59.450 回答