问题标签 [cjk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.htaccess - 如何通过.htaccess 控制目录列表的字符集?
我通过添加以下内容启用了 public_html 下文件夹的目录列表:
选项+索引
在 .htaccess 文件中。
但是,默认情况下某些文件未正确列出,因为某些文件名是中文(UTF-8 编码)。如果将浏览器的字符集编码更改为 UTF-8,我可以看到文件名。
如何让浏览器默认看到 UTF-8 格式的文件名?.htaccess 中是否有要添加的参数?我尝试添加:
添加默认字符集 utf-8
在 .htaccess 文件中,但它不会改变任何东西。
谢谢~
php - 如何使用正则表达式正确解析混合的拉丁/表意全文查询?
我正在尝试使用正则表达式来清理/格式化某些输入,以进行混合的拉丁语/表意文字(中文/日文/韩文)全文搜索。
我在一个我再也找不到的论坛上找到了一个有人尝试清理拉丁/亚洲语言字符串的旧示例(完全归功于此代码的原作者)。
我无法完全理解函数的正则表达式部分,特别是为什么它似乎对数字 0、2 和 3 的处理方式与其他基于拉丁文的数字 1,4-9 不同(基本上它处理数字 0、 4-9 正确,但查询中的数字 0,2-3 被视为亚洲字符)。
例如。我正在尝试清理以下字符串:
“hello 1234567890 蓄积した abc123def”
它会变成:
“hello 1 456789 abc1 def 2 3 0 蓄积した 2 3”
此净化字符串的正确输出应为:
“hello 1234567890 蓄积した abc123def”
如您所见,它正确地隔开亚洲字符,但数字 0、2、3 的处理方式与所有其他数字不同。关于为什么正则表达式以不同方式处理这些数字 0,2 和 3 的任何帮助将是一个很大的帮助(或者如果您知道实现类似结果的更好方法)!谢谢
我已经包含了下面的功能
更新:为清楚起见提供上下文
我正在创作一个将在中国推出的网站。该网站将具有搜索功能,我正在尝试为搜索查询输入编写解析器。
与英语使用“ ”作为句子中单词之间的分隔符不同,中文不使用单词之间的空格。因此,我必须通过拆分每个汉字并在数据库中单独搜索每个字符来重新格式化搜索查询。中国用户还将使用拉丁/英文字符来表示品牌名称等他们可以与他们的中文字符混合在一起的东西(例如,Ivy新闻铺)。
我想做的是将所有英文单词与汉字分开,并用空格分隔每个汉字。
搜索查询可能如下所示:Ivy 铺</p>
我想解析它,使它看起来像这样:Ivy 牛仔铺</p>
emacs - 如何让 Emacs 显示汉字
我经常使用简单的中文短语,例如“你好”来测试我的代码是否可以处理非 ascii 字符。每当我将汉字直接输入到 Emacs 中时,它们只是作为问号出来。
如果我打开预制的文本文件,Emacs 有时可以正确显示字符,但并非总是如此。例如,如果我在记事本中创建一个简单的文本文件,其中包含“你好”,那么“好”会显示得很好,但“你”只会显示一个框。Emacs 可以处理汉字吗?如果是这样,我该如何设置?
我在 Windows 上使用 Courier New 字体运行 Emacs 22.3.1,但我也对在 Linux 上进行这项工作感到好奇。我已经安装了所有需要的东方语言包。我可以在记事本中用中文编辑没有问题。
unicode - 乳胶 \section{} 中的日文字符导致错误
我正在努力获取用乳胶创建的日语文档。我已经安装了包含 CJK 的最新版本的 texlive-2008。
在我的文档中,我有以下内容:
在上面的代码中,有 3 个位置使用了日文字符。
1 + 3 工作正常,而在 \section{} 中包含日文字符的 2 失败并出现以下错误。
经过一些研究后发现,当您将脆弱的命令放入移动参数中时,就会出现此错误。例如,一个移动参数,因为部分可以移动到内容页面。
有谁知道如何让它工作以及为什么乳胶认为日文字符是“脆弱的”。
vim - 如何让 vim 识别 CJK 字符并使其大于 ASCII?
我正在使用 vim 处理中文和西文文本。西文的默认字体大小还可以,但汉字虽然可读,但对我来说太小了。我可以告诉 vim 使用 14pt 渲染 CJK 字体,同时不影响所有其他文本的字体大小吗?
感谢您的想法/解决方案!
古巴
iphone - 用于日语字符的 Iphone CGContextShowTextAtPoint
我正在开发一个CGContextShowTextAtPoint用于在屏幕上显示文本的应用程序。我还想显示日文字符,但CGContextShowTextAtPoint将 C 字符串作为输入。所以要么 A)如何将日文字符更改为 C 字符串?如果这是不可能的,B)如何手动将日文字符打印到屏幕上(在 drawRect 方法中)。
提前致谢。
java - 国际化英文和中文的 Swing Applet 菜单项 - 示例?
Java Swing 小程序需要以中文或英文显示其菜单项,这取决于用户如何设置他们的系统首选项。
有没有人看过可编译的例子来说明如何做到这一点?
我看过几篇关于 i18n 和 Java/Swing 主题的文章(例如,这篇文章),但到目前为止,我还没有找到任何关于 Swing、Applets 和 MenuItems 主题的文章。作为 i18n 的新手,我更喜欢一个工作示例来帮助我快速上手。
unicode - Unicode 中汉字的完整范围是多少?
U+4E00..U+9FFF是整套的一部分,但不是全部
php - Zend_Lucene CJK 支持
有人知道 Zend_Lucene 类是否支持 CJK(中文日文韩文)。
我想在我自己的网站上使用它,唯一的问题是它应该适用于英语和日语。
此外,如果有人有一些关于 Java 版本的 CJK 版本的资源,也将不胜感激。
谢谢
sql-server - 表名中带有中文字符的 DBCC CHECKIDENT 问题
我正在维护一个使用 SQL Server Express 2005 作为后端的应用程序。该应用程序允许用户创建新数据库并提供新数据库的名称。
当应用程序加载默认数据时,我进行以下 SQL 调用:
只要一切都是英文的,代码就可以正常工作。
但如果用户在数据库名称中指定中文字符,则调用如下所示:
此调用失败并显示以下错误消息:“找不到数据库'e???'。数据库不存在,或者在语句尝试使用它之前被删除。”
我使用正常工作的数据库名称进行了许多其他调用。例如,此语句执行没有问题。
该错误似乎特定于 DBCC CHECKIDENT 调用。有任何想法吗?
注意:我运行的是中文版的Windows XP。