问题标签 [internationalization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1568 浏览

python - 在嵌入式 Python 中使用 locale.setlocale 而不会破坏 C 线程中的文件解析

我们正在使用第三方中间件产品,它允许我们在嵌入式 Python 解释器中编写代码,并公开一个我们可以调用的 API。其中一些 API 调用允许我们加载各种文件,加载代码是用 C 实现的。文件加载发生在单独的线程中,并在数据可用时回调到 Python。到目前为止,一切都很好。

我们一直在 i14ing (heh) 我们的产品,我们想做的一件事是根据用户的区域设置格式化面向用户的数字输出。因此,从 Python 中,我们这样做:

现在,这可行(因为面向用户的数字已针对其区域设置正确格式化)。但是,如果用户的语言环境与默认的 C 语言环境不同,随后加载的任何文件都将返回不正确的数据,这可能是因为所有字符串到浮点数的转换都受到了影响,一直到金属。

我们无法通过实现区域设置感知文件加载来解决此问题,因此我们当前的解决方法是仅在为用户格式化输出时设置区域设置,然后再将其重新设置。也就是说,类似:

这似乎有点笨拙,我想知道这是否是为用户格式化区域设置感知输出的常用方法?我的另一个担忧是这显然不是线程安全的,所以如果在更改语言环境时在单独的线程中发生任何文件解析,我们可能仍然会遇到问题。

任何有关最佳实践的信息都值得赞赏 - 我对这类事情没有太多经验。

0 投票
5 回答
12326 浏览

php - 如何确保用户输入的包含国际字符的数据不会损坏?

即使 MySQL 数据库、表和字段的排序规则设置为 utf8_general_ci ,经常会发生诸如é之类的字符转换为é的情况。页面的Content-Type中的编码也设置为 UTF8。

我知道 utf8_encode/decode,但我不太确定在哪里以及如何使用它。

我已阅读“每个软件开发人员绝对、肯定必须了解 Unicode 和字符集(没有借口!) ”文章,但我需要一些 MySQL / PHP 特定的指针。

如何确保用户输入的包含国际字符的数据不会损坏?

0 投票
2 回答
2090 浏览

java - Java, unicode and fonts

I've looked at the java documentation and scoured the net for information on java's support for international characters with specific fonts (such as Monospace), but haven't been able to get a clear concrete answer.

There has been a change between java 1.4 and java 1.5/1.6. For example, in java 1.4 if you set the font on a JTextArea to Monospace, it won't be able to handle foreign characters (get rectangles instead), but in java 1.5/1.6 it seems to work fine.

Are these differences/improved support clearly documented anywhere?

Thanks

0 投票
7 回答
6588 浏览

algorithm - 从日语来源估计英语翻译单词数量的算法

我试图想出一种方法来估计从日语翻译成的英语单词的数量。日语有三种主要的文字——汉字平假名片假名——每一种都有不同的平均字词比(汉字最低,片假名最高)。

例子:

  • 电脑:コンピュータ(片假名 - 6 个字符);计算机(汉字:3个字)
  • 鲸鱼:くじら(平假名——3个字符);鲸(汉字:1个字符)

作为数据,我有大量的日文词汇及其英文翻译,以及相当大的匹配日文源文档及其英文翻译的语料库。我想提出一个公式来计算源文本中的汉字、平假名和片假名字符的数量,并估计这可能变成的英语单词的数量。

0 投票
4 回答
5268 浏览

internet-explorer - 文件下载时文件名损坏 (IE)

我已经实现了一个简单的文件上传-下载机制。当用户单击文件名时,将使用以下 HTTP 标头下载该文件:

我也支持日文文件名。为此,我使用此 java 方法对文件名进行编码:

到目前为止它运行良好,直到有人发现它不适用于长文件名。例如:あああああああああああああああ2008.10.1あ.doc。如果我将其中一个单字节点更改为单字节下划线,或者如果我删除了第一个字符,它可以正常工作。即,它取决于点字符的长度和 URL 编码。以下是几个例子。

这是坏的(あああああああああああああああ2008.10.1あ.doc):

这没关系(あああああああああああああああ2008_10.1あ.doc):

这也很好(あああああああああああああああ2008.10.1あ.doc):

有人有线索吗?

0 投票
5 回答
1899 浏览

php - php 代码库的 i18n 有哪些好的工具/框架?

我一直在寻找一些启用动态 php 应用程序本地化和国际化的选项。似乎有各种可用的工具,例如 gettext 和 Yahoo 的 R3,我很想听听开发人员和翻译人员的意见,哪些工具好用,哪些功能对简化实施和翻译任务很重要。

0 投票
4 回答
11739 浏览

language-agnostic - 国际化 Web 应用程序的最佳实践?

国际化网络应用程序似乎总是一件苦差事。无论您为可插入语言提前计划了多少,总是存在编码问题、不适合您的模板的时髦措辞以及其他问题。

我认为获得 SO 社区对程序员在决定将其 Web 应用程序国际化时应该注意的一组事情的意见会很有用。

0 投票
6 回答
8898 浏览

php - 您如何将现有的网络应用程序转换为多语言应用程序?

我将从事一个项目,其中需要调整一个相当大的网络应用程序以处理多种语言。这个东西使用手工制作的 PHP 代码运行,但它非常干净。

我想知道最好的方法是什么?

  1. 我自己做一些东西,试图适应实际的架构。

  2. 使用将为我管理 i18n 的框架(例如 Symfony)重写它的大部分内容?

对于选项 1,我应该在哪里存储 i18n 数据?*.po、xliff、纯数据库?

我想到了一个替代方案:仅使用 Symfony 进行翻译,但将控制器设置为按原样加载网站。很快,但很脏。另一方面,它允许我们进行下一次修改,慢慢地转向完整的 Symfony:这个网站确实是一个很好的候选者。

但也许有一些独立的翻译引擎会比整个 Web 框架做得更好。这有点像用火箭筒杀死苍蝇……

0 投票
3 回答
1884 浏览

ruby - What options do exist now to implement UTF8 in Ruby and RoR?

Following the development of Ruby very closely I learned that detailed character encoding is implemented in Ruby 1.9. My question for now is: How may Ruby be used at the moment to talk to a database that stores all data in UTF8?

Background: I am involved in a new project where Ruby/RoR is at least an option. But the project needs to rely on an internationalized character set (it's spread over many countries), preferably UTF8.

So how do you deal with that? Thanks in advance.

0 投票
1 回答
569 浏览

javascript - OpenSocial 小工具应用程序中的本地化

我正在尝试向 OpenSocial 应用程序添加多语言支持。我看到我可以在小工具 XML 标记中链接到我自己的消息包:

但是我如何真正从它们中提取值呢?