问题标签 [extended-ascii]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 如何通过 C++ 通过 JNI 传递扩展的 ASCII 字符
我正在尝试通过 VC++ 使用 JNI,并将类路径中的自定义目录作为 UTF-8 字符串 -Djava.class.path=c:\myDir\my.jar
这很好用,我可以使用 FindClass 在 jar 中找到方法
但是当目录名称包含任何扩展的 ASCII 字符时,FindClass 会返回 NoClassDefFound 异常。我想这是因为 JVM 无法加载 jar 文件,而且我在传递参数时做错了。
这是我所做的 1) 创建一个 std::wstring jarPath(L"-Djava.class.path=C:\ÆËñœ\my.jar"); 2) 使用 WideCharToMultiByte 将 wstring 转换为 CP_UTF8 3) 将 utf8String 复制到 optionString 并调用 JNI_CreateJavaJVM
在调用 JNI_CReateJavaJVM 之前,我尝试将转换后的 utf8 打印到日志文件中,并且打印效果很好。
有人能告诉我 CP_UTF8(在 windows SDK WinN;sh 中定义)是否不是 JNI 所期望的吗?我该如何调试这个问题,非常感谢任何帮助。
提前感谢拉胡尔
sql-server-2008 - What is the correct SQL DataType to represent my Object?
My object is a string, implemented as an array of 1-50 US-ASCII data characters.
- What SQL Data Type should I use to represent this in my database table?
- I am using SQL Server Express 2008. (Does that matter?)
- Does representing Extended ASCII require a different datatype than representing Standard ASCII?
character-encoding - 以下德语单词使用什么字符编码?
我正在尝试处理德语单词列表,但无法弄清楚文件的编码方式。'file' unix 命令说该文件是“非 ISO 扩展 ASCII 文本”。大多数单词都是 ascii 格式,但以下是例外:
任何提示都会很棒。谢谢!
编辑:为了清楚起见,上面的十六进制代码是 C 十六进制字符串文字,因此将 \xXX 替换为文字十六进制值 XX。
c# - 转换扩展的 ASCII/ANSI 值
我有一个程序,它输入文本并使用许多函数对其进行排序,无论格式如何,文本都应该是可读的,但是,当导入保存为扩展 ASCII 编码的文件时,任何超过 127 个字符都将被忽略。环顾四周,我似乎不知道如何克服这一点。这些文件在 UTF-8 和 Unicode 中可以很好地读取。我已经尝试将字符串转换为 UTF-8,但是有问题的字母仍然只是像问号一样出现在形状上。我可以看到这些值是正确的:û 为 0xBF,但它们并未被解释为值。
任何人都可以在这里帮助我,我以前没有做过很多这样的事情。如果有帮助,我正在使用 C#。
我当前的转换代码如下所示:
sd
字符串在哪里。当我导入这个字符串时,我没有指定文本编码:
sql-server-2008-r2 - 在 SQL Server 批量插入中,如何为字段和行终止符使用更高的 ASCII 字符
我有一个可以在 SQL Server 2000 上运行的批量插入,我试图在 SQL Server 2008 R2 上运行,但它没有像我希望的那样工作。我已经成功地将这些批量插入运行到 SQL 2000 中,如下所示:
格式文件:
数据文件:
批量插入命令:
现在我在 SQL 2008 R2 机器上运行,我收到以下错误:
如果我将我的字段终止符从 ascii 249 (ù) 更改为逗号 (,) 并将我的行终止符从 ascii 250 (ú) 更改为分号 (;),一切都会运行。但是,这不是一个真正的选择(数据中肯定会有这些字符),我宁愿不为我的分隔符选择一些任意字符串,如 !@#$%^&*() (必须编辑更多代码那样)。
我尝试了一些代码页、数据文件类型、排序规则、sql 兼容级别和格式文件版本的组合,但无济于事(并不是说我有专业知识知道所有这些将如何交互以更改此处的任何内容)。批量插入 MSDN 文档的各个部分都引用了有关大于 127 或小于 32 的 ascii 字符的特殊规则,但我不太清楚这将如何影响分隔符。
我能做些什么来尽可能少地接触代码但让它在我的新服务器上运行?
更新(解决方案)
感谢@Adam Wenger 的评论,我找到了解决方案。为了处理我的数据中包含扩展的 ASCII字符,我不再使用格式文件,而是将批量插入数据文件作为 unicode(不是 ANSI)写入文件系统(即使我的数据中确实没有 unicode 字符) . 这是我的新批量插入语句(注意“widechar”):
无论我尝试什么,我都无法获得一个格式文件来处理扩展的 ASCII 字符(超过 127 个)。我只是摆脱了格式文件,现在将其他字段分隔符放在我的数据文件中,以表示我不导入的列(我在这些列上有默认值)。
c++ - Code::Blocks C++ 中的扩展 Ascii 字符
我正在尝试在使用 C++ 和 Code::Blocks(字符代码大于 128)的控制台应用程序中使用扩展的 Ascii 代码。http://www.asciitable.com/ 控制台在菱形内显示一个问号。
到目前为止我尝试过:
batch-file - 是否可以在 BAT 文件中使用扩展的 ASCII 字符?
我有一堆动态创建的 *.BAT 文件。这些 BAT 文件用于在服务器中创建文件夹。每个 BAT 文件中只有一行,例如:MKDIR \NetworkShare\abc\123
这个“abc\123”字符串来自数据库。
它可以运行一段时间以按需创建数千个子文件夹,直到今天它停止创建一个特殊的子文件夹,该文件夹在字符串中具有“关闭单引号”( Alt+如果从 dos 提示符键入)。0146
我做了一些研究,发现这个“关闭单引号”是一个扩展的 ASCII 字符。它无法正确保存在 ANSI BAT 文件中(以其他方式结束)。我尝试了 UNICODE 和 UTF-8 BAT 文件,但它不起作用。
唯一接近关闭的解决方案是我尝试了二进制编辑器以确保它是代码 146,但代码 146 给了我 Æ (ALT-146) 而不是“关闭单引号”( Alt+ 0146)。
我知道我可以在 DOS 提示符下手动键入特殊字符(通过使用键盘Alt+ )。但是有没有办法将这个“关闭单引号”(Alt+ 0146)正确保存在 BAT 文件中,以便我可以动态执行它们?
主机系统是 Windows Server 2003 US-English。
java - Java HtmlCleaner:不处理扩展的 ascii 字符
我正在使用 HTMLCleaner 清理一个 HTML 文件,该文件包含“€”(ascii 十进制 128)、“TM”(ascii 十进制 153)等字符。也就是说,来自 ASCII 扩展表的字符。
HTMLCleaner 无法处理这些字符并将它们替换为字符“?” (ASCII 十进制 63)。
为了处理这些字符,我可以在 HTMLCleaner 中设置任何标志吗?
提前致谢。
编辑: 变量“编码”是“iso-8859-1”,就像源文件编码一样。
我刚刚想通了。该行:
应替换为:
其中 'encoding' 是源 url 的字符集的字符串表示形式。
谢谢!
sql-server-2008 - Powershell将字符转换为ASCII
目前我有一个正在扫描 SQL Server 表并正在读取包含文本的列的 powershell 进程。目前,我们的字符位于扩展的 ASCII 域中,导致我们的下游流程中断。我最初在 SQL Server 中识别出这些差异,但在文本解析方面很糟糕,所以我决定编写一个结合正则表达式的 powershell 脚本来执行此操作。我也会为此发布代码,以帮助其他迷失的灵魂寻找这样的正则表达式。
当我想在一封电子邮件中显示一些 ascii 值说我正在清理数据时,问题就出现了。这些数字与 SQL Server 不同。小心我不确定您的结果是否与从浏览器复制的结果相同,因为这些是扩展的 ascii。
在PowerShell中
在 SQL Server 中
如果有的话,powershell 中的内容将帮助您在 ASCII 查找中获得与 SQL Server 相同的结果。
TLDR;所以我的问题是,上面是否是在 powershell 中查找 ASCII 值的正确方法,因为它适用于大多数值,但不适用于 ASCII 值 150(这是来自 word 的长破折号)。