问题标签 [kanji]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
words - 日文 Unicode:将部首转换为常规字符代码
如何将日文部首字符转换为“常规”汉字字符?
例如,部首火的字符是⽕(Unicode 值为 12117)
并且常规字符是火(Unicode 值为 28779)
编辑:
澄清一下,我认为我需要这个的原因是因为我想通过使用 kanjivg 数据集来获取每个部首的笔画信息。但是,(我需要进一步研究),我不确定 kanjivg 是否有部首字符的笔画数据,但它肯定有常规汉字字符的笔画数据。
我正在使用的语言是 Java——但我认为任何语言的转换都是相似的。
java - 使用 VTD-XML 的带有 & 符号的 XML 文件的 ParserException
我正在尝试使用 VTD-XML 解析 JMDict 项目中的 JMDict_e.xml 文件。但是,我遇到了解析错误。
出现的唯一错误消息是:
xml 的简短摘录如下所示:
我相信在pos
字段中,非法字符很可能是&符号。有没有办法让 vtd-xml 不将这些 & 符号视为特殊字符?还是有不同的方法来解决这个问题?
java - Java XML Parsing - VTD-XML 数据的错误字符串版本
我正在使用 VTD-XML 使用 Java 解析 UTF-8 编码的 XML 文档。
一小段摘录如下:
我想遍历每个文字并将其打印到控制台。但是,我得到的是:
我正确导航到每个元素。我获取文本值的方法是调用:
我也尝试过vn.getXPathStringVal();
,但是它产生了相同的结果。
我知道上面的每个文字都不仅仅是长度为 1 的字符串。相反,它们似乎是由两个字符组成的 unicode“字符”。如果它们的长度只是一个,我能够正确解析和输出汉字字符。
我的问题是 - 如何使用 VTD-XML 正确解析和输出这些字符?有没有办法在文字标签之间获取文本的底层字节,以便我自己解析这些字节?
编辑
处理 XML 每一行的代码 - 将其转换为字节数组,然后再转换回字符串。
c++ - 在 C++ 中处理汉字字符
我有一个用 C++ 编写的 Windows 桌面应用程序(名为:Timestamp),它使用称为 CLR 的 .NET。
我还有用原生 c++ 编写的 DLL 项目(名为:Amscpprest),并使用 CPPREST SDK 从服务器获取 json 数据并将数据传递给我的 Timestamp 应用程序。
这是场景:这是从我的服务器返回的 json 数据,它是一个员工姓名列表,其中大部分是用汉字字符写的日本名字。
这是我的 DLL 项目 (Amscpprest) 中的代码。这是获取数据并传递给我的 CLR 项目的方式:
这是我在 CLR 项目中的代码(时间戳)。这就是我从我的 dll 项目中接受数据并显示到用户界面的方式。
我希望有人可以帮助我解决这个问题。
perl - 按自定义汉字索引对日语词汇字段进行排序
我一直在使用一个 10 多年前创建的 PERL 程序,它输入日文文本(词汇表)和自定义汉字索引(例如 RTK 或 KKLC 或 2k1KO 或频率),并根据最大的汉字索引输出日文文本出现在那个文本中。这个想法是将使用汉字的单词放在索引列表的下方,进一步放在词汇列表的下方。最近几个月随着 Strawberry 的更新,该程序停止工作并输出以下错误:
在 C:/Strawberry/perl/lib/warnings.pm 第 377 行的 vec 中使用未初始化的值 $mask。在 kanji-sort-1.5.pl 第 8 行的未知 PerlIO 层“编码”在 C:/ 的未知 PerlIO 层“编码” Strawberry/perl/lib/open.pm 第 120 行。C:/Strawberry/perl/lib/open.pm 中的未知 PerlIO 层“编码”第 128 行。C:/Strawberry/perl/lib/ 中的未知 PerlIO 层“编码” open.pm 第 129 行。在 C:/Strawberry/perl/lib/warnings.pm 的 vec 中使用未初始化的值 $mask 第 412 行。在 C:/Strawberry/perl/ 中按位和 (&) 使用未初始化的值 $mask lib/warnings.pm 第 424 行。名称“Getopt::Long::CallBack::OVERLOAD”仅使用过一次:C:/Strawberry/perl/lib/overload.pm 第 11 行可能存在拼写错误。未知 PerlIO 层“编码”位于kanji-sort-1.5.pl 第 21 行。kanji-sort-1.5.pl 第 22 行关闭文件句柄 KANJI 上的 readline()。
我能做些什么来让这个程序再次运行吗?
这是程序。将词汇分解成字符并根据其中的最高索引分数给它们一个基于汉字的值似乎很简单。:
dictionary - 用字典编码日语 - 英语
我有一本日语词典——英语。但是,我不懂日语,它是如何编码的!谁能告诉我那是什么?非常感谢
示例: https ://i.stack.imgur.com/Rl6Tg.png
S”X [‚µ‚ñ‚Ì‚¤] /(n) 心包/
S”x‹@”\ [‚µ‚ñ‚Ï‚¢‚«‚Ì‚¤] /心肺功能/
S”z [‚µ‚ñ‚Ï‚¢] /(adj-na,n,vs) 担心/担心/焦虑/关心/(p)/
S”z‚è [‚±‚±‚‚‚‚‚΂è] /(n,vs) 用心/注意/体贴/周到/
S”z‚ðŠ|‚¯‚é [‚µ‚ñ‚Ï‚‚‚ð‚©‚¯‚é] /(exp)使某人担心/
S”zŽ– [‚µ‚ñ‚Ï‚‚‚²‚Æ] /(n)担心/关心/麻烦/
S”z« [‚µ‚ñ‚Ï‚¢‚µ‚傤] /(n) 容易担心/
S” [‚µ‚ñ‚Ï‚] /(n) 心率/
S”²,«Ší [,µ,ñ,Ê,«,«] /corer/
S•s'S [‚µ‚ñ‚Ó‚º‚ñ] /(n) 心力衰竭/
azure-cognitive-services - Microsoft 认知服务:文本翻译:将汉字音译为拉丁文不正确?是否有 Bing 网站来测试音译?
我正在尝试使用 Microsoft 的 Cognitive Services Translator Text 来音译文本。汉字的结果似乎不正确。
以下是汉字的 3 个示例:
こんにちは<br/> j-talk.com:Konnichiwa
Translate.Google.com 音译:Kon'nichiwa
Bing 翻译:你好
译者文本:
音译:connich -这个结果似乎不完整
翻译:你好
乌丸通七条下ル
Hand 音译:Karasuma-Shichijō-sagaru
j-talk.com:Karasuma tsū shichijō sagaru
Translate.Google.com 音译:Karasuma dōri nana-jō kudaru
Bing 翻译:Karasuma-Dori Shichijo-Le
翻译文本 API 调用: imartsunanajoukar
这个结果似乎是错误的。日语不应该有字母“r”
东塩小路町 721-1 注:这是一个地址
手译:Higashi-Shiokōji 721-1
j-talk.com:Higashi shiokōji machi 721-1
Translate.Google.com 音译:Higashishiokouji-chō 721 - 1
Bing 翻译:Higashi -Shikoji-machi 721-1
翻译文本:由于数字字符而无法音译。
翻译 API 处理数字,但音译 API 不处理。
所以我有两个问题:
1)微软会纠正/改进汉字音译吗?
2) 有没有像 www.bing.com/translator 这样的网站,我可以在其中确认我得到的音译结果是可以预期的?
谢谢你。
sql-server - 为什么在 SQL Server 中是和是相同的
在 SSMS v17.9 中,连接到 SQL Server 14.0.1000 实例时,系统将这两个字符视为相同:和
我设置了一个 [Char] NVARCHAR(2) 作为主键的 [Kanji] 表。添加“”后,我无法添加“”,因为它引发了“密钥重复”错误。
我运行了这个 T-SQL:
结果打印出“真”。