问题标签 [kanji]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
979 浏览

words - 日文 Unicode:将部首转换为常规字符代码

如何将日文部首字符转换为“常规”汉字字符?

例如,部首火的字符是⽕(Unicode 值为 12117)

并且常规字符是火(Unicode 值为 28779)

编辑:

澄清一下,我认为我需要这个的原因是因为我想通过使用 kanjivg 数据集来获取每个部首的笔画信息。但是,(我需要进一步研究),我不确定 kanjivg 是否有部首字符的笔画数据,但它肯定有常规汉字字符的笔画数据。

我正在使用的语言是 Java——但我认为任何语言的转换都是相似的。

0 投票
1 回答
314 浏览

java - 使用 VTD-XML 的带有 & 符号的 XML 文件的 ParserException

我正在尝试使用 VTD-XML 解析 JMDict 项目中的 JMDict_e.xml 文件。但是,我遇到了解析错误。

出现的唯一错误消息是:

xml 的简短摘录如下所示:

我相信在pos字段中,非法字符很可能是&符号。有没有办法让 vtd-xml 不将这些 & 符号视为特殊字符?还是有不同的方法来解决这个问题?

0 投票
1 回答
165 浏览

java - Java XML Parsing - VTD-XML 数据的错误字符串版本

我正在使用 VTD-XML 使用 Java 解析 UTF-8 编码的 XML 文档。

一小段摘录如下:

我想遍历每个文字并将其打印到控制台。但是,我得到的是:

我正确导航到每个元素。我获取文本值的方法是调用:

我也尝试过vn.getXPathStringVal();,但是它产生了相同的结果。

我知道上面的每个文字都不仅仅是长度为 1 的字符串。相反,它们似乎是由两个字符组成的 unicode“字符”。如果它们的长度只是一个,我能够正确解析和输出汉字字符。

我的问题是 - 如何使用 VTD-XML 正确解析和输出这些字符?有没有办法在文字标签之间获取文本的底层字节,以便我自己解析这些字节?

编辑

处理 XML 每一行的代码 - 将其转换为字节数组,然后再转换回字符串。

0 投票
1 回答
733 浏览

c++ - 在 C++ 中处理汉字字符

我有一个用 C++ 编写的 Windows 桌面应用程序(名为:Timestamp),它使用称为 CLR 的 .NET。

我还有用原生 c++ 编写的 DLL 项目(名为:Amscpprest),并使用 CPPREST SDK 从服务器获取 json 数据并将数据传递给我的 Timestamp 应用程序。

这是场景:这是从我的服务器返回的 json 数据,它是一个员工姓名列表,其中大部分是用汉字字符写的日本名字。

这是我的 DLL 项目 (Amscpprest) 中的代码。这是获取数据并传递给我的 CLR 项目的方式:

这是我在 CLR 项目中的代码(时间戳)。这就是我从我的 dll 项目中接受数据并显示到用户界面的方式。

我希望它应该在列表视图中正确显示名称和 ID,但结果如下: 在此处输入图像描述

我希望有人可以帮助我解决这个问题。

0 投票
1 回答
98 浏览

perl - 按自定义汉字索引对日语词汇字段进行排序

我一直在使用一个 10 多年前创建的 PERL 程序,它输入日文文本(词汇表)和自定义汉字索引(例如 RTK 或 KKLC 或 2k1KO 或频率),并根据最大的汉字索引输出日文文本出现在那个文本中。这个想法是将使用汉字的单词放在索引列表的下方,进一步放在词汇列表的下方。最近几个月随着 Strawberry 的更新,该程序停止工作并输出以下错误:

在 C:/Strawberry/perl/lib/warnings.pm 第 377 行的 vec 中使用未初始化的值 $mask。在 kanji-sort-1.5.pl 第 8 行的未知 PerlIO 层“编码”在 C:/ 的未知 PerlIO 层“编码” Strawberry/perl/lib/open.pm 第 120 行。C:/Strawberry/perl/lib/open.pm 中的未知 PerlIO 层“编码”第 128 行。C:/Strawberry/perl/lib/ 中的未知 PerlIO 层“编码” open.pm 第 129 行。在 C:/Strawberry/perl/lib/warnings.pm 的 vec 中使用未初始化的值 $mask 第 412 行。在 C:/Strawberry/perl/ 中按位和 (&) 使用未初始化的值 $mask lib/warnings.pm 第 424 行。名称“Getopt::Long::CallBack::OVERLOAD”仅使用过一次:C:/Strawberry/perl/lib/overload.pm 第 11 行可能存在拼写错误。未知 PerlIO 层“编码”位于kanji-sort-1.5.pl 第 21 行。kanji-sort-1.5.pl 第 22 行关闭文件句柄 KANJI 上的 readline()。

我能做些什么来让这个程序再次运行吗?

这是程序。将词汇分解成字符并根据其中的最高索引分数给它们一个基于汉字的值似乎很简单。:

0 投票
1 回答
27 浏览

dictionary - 用字典编码日语 - 英语

我有一本日语词典——英语。但是,我不懂日语,它是如何编码的!谁能告诉我那是什么?非常感谢

示例: https ://i.stack.imgur.com/Rl6Tg.png

S”X [‚µ‚ñ‚Ì‚¤] /(n) 心包/

S”x‹@”\ [‚µ‚ñ‚Ï‚¢‚«‚Ì‚¤] /心肺功能/

S”z [‚µ‚ñ‚Ï‚¢] /(adj-na,n,vs) 担心/担心/焦虑/关心/(p)/

S”z‚è [‚±‚±‚‚‚‚‚΂è] /(n,vs) 用心/注意/体贴/周到/

S”z‚ðŠ|‚¯‚é [‚µ‚ñ‚Ï‚‚‚ð‚©‚¯‚é] /(exp)使某人担心/

S”zŽ– [‚µ‚ñ‚Ï‚‚‚²‚Æ] /(n)担心/关心/麻烦/

S”z« [‚µ‚ñ‚Ï‚¢‚µ‚傤] /(n) 容易担心/

S” [‚µ‚ñ‚Ï‚] /(n) 心率/

S”²,«Ší [,µ,ñ,Ê,«,«] /corer/

S•s'S [‚µ‚ñ‚Ó‚º‚ñ] /(n) 心力衰竭/

0 投票
0 回答
281 浏览

docker - SKK 用于假名到汉字的逆变器

0 投票
1 回答
157 浏览

azure-cognitive-services - Microsoft 认知服务:文本翻译:将汉字音译为拉丁文不正确?是否有 Bing 网站来测试音译?

我正在尝试使用 Microsoft 的 Cognitive Services Translator Text 来音译文本。汉字的结果似乎不正确。

以下是汉字的 3 个示例:

こんにちは<br/> j-talk.com:Konnichiwa
Translate.Google.com 音译:Kon'nichiwa
Bing 翻译:你好
译者文本:
  音译:connich -这个结果似乎不完整
  翻译:你好

乌丸通七条下ル
Hand 音译:Karasuma-Shichijō-sagaru
j-talk.com:Karasuma tsū shichijō sagaru
Translate.Google.com 音译:Karasuma dōri nana-jō kudaru
Bing 翻译:Karasuma-Dori Shichijo-Le
翻译文本 API 调用: imartsunanajoukar
  这个结果似乎是错误的。日语不应该有字母“r”

东塩小路町 721-1 注:这是一个地址
手译:Higashi-Shiokōji 721-1
j-talk.com:Higashi shiokōji machi 721-1
Translate.Google.com 音译:Higashishiokouji-chō 721 - 1
Bing 翻译:Higashi -Shikoji-machi 721-1
翻译文本:由于数字字符而无法音译。
  翻译 API 处理数字,但音译 API 不处理。

所以我有两个问题:
1)微软会纠正/改进汉字音译吗?
2) 有没有像 www.bing.com/translator 这样的网站,我可以在其中确认我得到的音译结果是可以预期的?

谢谢你。

0 投票
3 回答
104 浏览

sql-server - 为什么在 SQL Server 中是和是相同的

在 SSMS v17.9 中,连接到 SQL Server 14.0.1000 实例时,系统将这两个字符视为相同:

我设置了一个 [Char] NVARCHAR(2) 作为主键的 [Kanji] 表。添加“”后,我无法添加“”,因为它引发了“密钥重复”错误。

我运行了这个 T-SQL:

结果打印出“真”。

0 投票
1 回答
302 浏览

java - 有什么方法可以从平假名获得日语汉字建议?安卓

是否有一个库或任何方式可以实现此功能,该功能采用平假名字符并在 android 中返回汉字建议。

在这里解释一下我的情况,

我有一个文本视图,我将它的文本设置为用户从出现在屏幕上的自定义键盘中选择的任何平假名字符,然后将字母附加到文本视图中,它应该为它建议汉字符号。例如:如果用户选择ぐ,那么它应该建议具,愚,组等,汉字。

这个建议的汉字可以显示在另一个文本视图上。

我只想知道这是否有可能实现以及如何做到这一点。

这是我定制的软键盘(部分) 在此处输入图像描述