问题标签 [extended-ascii]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 通过标记匹配字符串 - 概念检查
这个问题用于概念检查。我有一个字符串 000.00-010.0.0.0 我想从列表 {000.00-012.0.0.0 和 000.00-008.0.0.0} 中找到最接近的匹配项(在编辑度量中包含一个数字距离度量)我会喜欢以'012','010'和'008'作为标记并测量它们之间的距离。
字符串匹配的标准方法将查找每个字符位置的变化,对变化求和并返回一个距离。修改后的距离也将测量 CHARS 之间的 ASCII 距离 - G 离 E 比 D 更远。
要测量 '012' 与 '008' 一样是 '010',需要将三个字符捆绑到一个令牌中。可以轻松测量此令牌的编辑距离和距离吗?由于删除了树数据库中的定界符,问题似乎更加复杂。
我想要进行实际检查的建议解决方案是将“012”、“010”和“008”转换为单个 CHAR ASCII 符号,例如 )、* 和 +,测量字符距离和字符串编辑距离,然后打印转换回“012”、“010”和“008”。
示例字符串:MER99.C0.00M.14.006.00.060.350
而且,还有通配符:
MER99.*.006.00.060.350
MER99.C0.00M.??.006.00.060.350
由于字符串的长度相同(有些需要虚拟字符作为长度,'00M'实际上是'M')匹配与汉明距离。
我不需要匹配算法、汉明距离方法、通配符或虚拟字符的帮助,我将其添加到问题的上下文中。现在,我将令牌视为单独的字符并获得良好的结果,但知道它们不如作为令牌处理时那样精确。限制因素可能是编码模式中的不一致。但是,我想以此作为限制,而不是我的算法。
c# - 如何读取 ASCII 值在 128-130 范围内的字符并将其转换为 int 值
我有一个字符数组,其中一些是十进制的 ASCII 128 和 130。我试图将它们作为普通字符读取,但我得到的不是 128,而是 8218 作为 int(转换为字节,得到 26)。我需要得到 128 到 130 之间的数字。我发现了一些关于 Encodings 的文章,有人说我需要使用 Encoding 439。
有任何想法吗?
javascript - javascript 字符串的扩展 ASCII 的有效字符子集
我正在做一些数据编码的实验。我知道已经有 base64 格式,但我想要占用更少空间的东西。请注意,我要求的是特定的字符,而不仅仅是他们的数量。
1、扩展ASCII的哪些字符子集可以用Javascript字符串表示?
2. 扩展 ASCII 的哪些字符子集可以用 Javascript 字符串表示而无需转义,假设字符串数据周围使用了 " 字符?
c# - 如何在 Windows 窗体 C# 中将扩展 ASCII 转换为十进制?
我正在编写一个 Windows 应用程序。在将扩展 ASCII [128-256]转换为其十进制等效项时遇到问题。
当我从 jar 文件中接收到扩展的 ASCII 比如说“Œ”时,它会像这样进入 C# 应用程序:�.
我能知道如何将其转换为等效的十进制数 [即] 140。
请帮我。我应该如何进行??
c# - Java 到 C# - 从 jar 服务器向 C# 客户端发送/读取字节
我正在编写一个 Windows 应用程序。从 jar 文件发送/接收字节时遇到问题。
jar 文件向我发送一个 2 字节 [即。!©]
我可以正确读取第一个字节,因为它在字符代码 0-127 内。但是对于第 2 个字节:扩展的 ASCII 表示来自 jar 文件的“©”,它以 .</p> 的形式进入 C# 应用程序
同样,当我将“©”发送到 jar 文件时,jar 将其读取为
请指导我如何解决这个问题。
我正在使用此代码从 jar 中读取字节:
我正在使用此代码将字节发送到 jar:
请帮助我好吗?如何在 C# 和 java 中获得相同的字符代码?
linq-to-sql - LinqToSQL 认为相同的不同 ASCII 符号/字符
我刚刚发现在 LinqPad 中运行查询时出现了一些奇怪的行为。LinqToSQL 似乎认为某些 ASCII 符号/字符是相等的,而实际上它们并非如此。
考虑以下类(带有相应的表):
如果您在表中为“⇒”(右箭头)和“⇐”(左箭头)添加一行,以下查询将告诉您它们相等(结果将包含两项):
通过添加对 .ToList() 的调用来更改查询将导致预期的行为(结果为空):
任何想法这是怎么回事?
utf-8 - 确保从扩展 ASCII 编码为 UTF8 时的一致性
也许这不是问题,但我期待 SO 收集的智慧来帮助我找出答案。
我们正在努力确保跨平台的编码是一致的。要走的路显然是UTF8。但是,不幸的是,某些平台使用扩展的 ASCII(通常是某种形式的 Windows 代码页),我们担心当使用变音符号从 Windows 代码页到 UTF8 进行编码时,在 UTF8 中对于字符有多种可能的选择。
在不同的平台(Linux、Mac OS)上,我们如何确保那里选择的 UTF8 字符是一致的?
正如我所说,也许这不是问题。也许有一些我不知道的标准映射。我们没有看到任何问题,但一位同事刚刚提出了这个问题,所以我正在寻找信息。
谢谢大家。
sql-server - SQL Server 中的扩展 ascii 字符搜索
我有一个表,其中一列可能包含包含扩展 ASCII 字符的数据(如♥,♦,♣....
)
当我使用查询搜索相同select
的结果集时,结果集并没有准确地获取 ex:
当我搜索任何具有扩展 ASCII 字符的名称时,如下所示
结果集显示 id2、id3。
那也是用问号 ( ?
) 符号而不是原始字符。
有什么帮助吗?我的结果集应仅id2
针对上述搜索查询显示
php - 为什么 str_replace 不能正确替换这些扩展的 ascii 字符?
这是一个 UTF-8 编码的源文件。我一定遗漏了一些明显的东西,但我已经尝试了我能想到的所有排列。
当我在浏览器中打开它并查看源代码时......
mysql - 扩展的 ASCII 字符显示为 MySQL db 中的垃圾是通过 perl 插入的
我有一个 MySQL 'articles' 表,我正在尝试使用 SQLyog 进行以下插入。
这工作正常,当我进行选择查询时数据显示正常。
问题是,当我通过我的 perl 脚本执行相同的插入查询时,名称会出现一些垃圾字符,而不是数据库中的 é 和 ô。我需要知道如何通过我的脚本正确存储名称。执行插入的代码部分是这样的。
$id 和 $title 具有正确的所需数据,我在插入它们之前已通过打印检查过这些数据。请协助。