3

半角、全角、片假名、平假名、汉字和使用替代字符(例如用そ代替ん)的组合太多。

Python 有一个名为jcconv的包,它可以帮助我做我需要做的事情。我想将字符串转换为标准形式,这样我就可以查看我的受限单词列表。

这在Lua中可能吗?

4

1 回答 1

0

为了能够在平假名、片假名和半角片假名之间转换字符串,您可以将各自的字母字符存储在不同的表中,并在它们之间添加映射(通过索引或键)。

从来源(链接)来看,jcconv 也是这样做的。

例如,如果您想将平假名转换为片假名,您可以这样做:

  • 建立一个表,其中每个元素都定义为[hiragana] = katakana.
  • 逐个字符地迭代字符串并替换(如果是这种情况,我发现一个小库正是这样做的:utf8.lua提供了一个接受映射表的替换函数)。
于 2013-09-02T13:27:29.153 回答