问题标签 [extended-ascii]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
125 浏览

c - 扩展 ACSII 在 C 中阅读非英文文本的问题

我一直在尝试解决扩展 ASCII 的问题。我有一个程序可以读取文本文件并提取单词。问题是文本可能是带有重音的语言。

我阅读了很多关于与扩展 ASCII 相关的问题的信息。但是,我没有给出允许我仅使用标准库来解决问题的示例或信息。

我的程序应该能够读取文本文件(程序已经这样做了)并删除可能包含重音的单词,将各种图形分数丢弃为¿¡等。另外,我读到您应该使用unsigned char并因此能够捕获从 0 到 256 编码的任何字符。但是,该实现也不适用于 unsigned char。

我正在使用 fgetc 函数逐个字符地收集。问题是程序却丢弃了重音字母í、ç、ê、ô等项目,所以你不应该花太多的钱。

有没有人有在解释的条件下运行的推荐或示例程序?

0 投票
0 回答
26 浏览

text - 操作系统如何/为什么操作系统会呈现这样的文本?

文本如何/为什么会发生这种情况?


t̡͕̭ͮͥ̂ͥ̿́̂h̻͔̱̙͍͕̍ͫͫ͂͛͑͗ͦ́a̹̗̟̞͔̥̥̋̽̍̾͗̆ͥͪt̂͟͠͏̖̟̘̗̳̤̗̮'s͖̭͉̗̜̯̖ͪͯ̍̅̕m̴̫̙͓̙͖̓̈͢m̴̫̙͓̙͖̓̈͢m̴̫̙͓̙͖̓̈͢s̡̔͂̀҉̣̺̭̹͚̜͖s̡̔͂̀҉̣̺̭̹͚̜͖s̡̔͂̀҉̣̺̭̹͚̜͖s̡̔͂̀҉̣̺̭̹͚̜͖s̡̔͂̀҉̣̺̭̹͚̜͖s̡̔͂̀҉̣̺̭̹͚̜͖s̵̮̹ͥ̍͡s̵̮̹ͥ̍͡s̵̮̹ͥ̍͡s̵̮̹ͥ̍͡w̴̢͙̽ͧ̍͆r̳̳͖͎͎͂̂͑̀ͯ̐̽̕ir̳̳͖͎͎͂̂͑̀ͯ̐̽̕i̗͕̎ͥ̐͡t͓͍̬̹̅̅ͦ̏̃į̛̭̱̣͚̱͇̫͗死,̰̱̹̘̣͔̮͕̼ͩ̈́̉͌́̀͞ b̶̸̻͖͓̻̜ͨ͋͒ͯ̎͐ͪu̵̫̜̺̥̎̊ͅẗ̸̻̩̰͉̭̲̝̗̿ͫ̋͛̄ͯ̏̀͢b̶̸̻͖͓̻̜ͨ͋͒ͯ̎͐ͪu̵̫̜̺̥̎̊ͅẗ̸̻̩̰͉̭̲̝̗̿ͫ̋͛̄ͯ̏̀͢ ̵̫̜̺̥̎̊ͅẗ̸̻̩̰͉̭̲̝̗̫͔͍͍̳̼͉͉̿ͫ̋͛̄ͯ̏̀̄̔͢T͐͗̑͊̎ͤ҉̡͈̼̰͍̻H̡̳̗͍͚̦̗̘̫ͬ̓ͩ͋̃͂ͅę̠̻̗̖̘̲̦͈̥͉̫̙͉̼ͧͫ̔͗̈͠͡b̛̭̤̤̞̟̈́͆̀ b的ution̫̤ͤͣͯ̓̅̉m̸͈̺̞̤̀̆͠m̸͈̺̞̤̀̆͠m̸͈̺̞̤̀̆͠m̸͈̺̞̤̫̤̥̲̲̘̩̀̆ͤͣͯ̓̅̉̊ͩͭ̋͠

0 投票
2 回答
205 浏览

linux - 删除扩展的 ASCII 字符。Linux 脚本 (128-255)

我想在我的文本中删除任何类型的 ASCII 字符,其代码间隔为 [128-255]。gsub(/[^az]/, "", $0) --这就是我删除除字母之外的所有内容的方法;gsub(/ē|é|ě|è|ū|ú|ǔ|ù|ǖ|ǘ|ǚ|ǜ|ü|ō|ó|ǒ|ò|ī|í|ǐ|ì|ā|á|ǎ |à|å|ä|â/, "", $0) -- 这是我删除一些扩展字符的方法,但不是所有字符。gsub(/"[\128-\255]"/, "", $0) 我正在尝试这个,但它显示了一个错误,无效的间隔。那么,任何人都可以帮助解决这个问题。预先感谢。

0 投票
2 回答
380 浏览

linux - Mac 与 Linux 中的可打印字符

如果我从 Mac 上的命令行执行此操作(终端中的 UTF-8 和文件):

我在输出文件中得到的结果与在 Linux 系统上运行相同的命令不同(终端中的 UTF-8 和文件)。

这可能是什么原因?

这是在 Mac 上运行命令时仍然存在的示例字符:š(该字符是扩展的 ASCII 字符 0x9A/s,带有 caron)。在 Linux 上运行该命令时会删除相同的字符。

0 投票
1 回答
510 浏览

php - PHP 字符串的字符是有符号还是无符号,为什么 ord("Ø") 与扩展的 ASCII 表不匹配?

0 投票
2 回答
1057 浏览

c# - 使用 Unicode 编码读取 txt 文件——C++/C#

我最近对制作/模拟 80 年代基于文本的 rpgs 产生了兴趣,比如 Rogue 及其衍生品,它们的特色图形是由扩展的 ASCII 字符组成的。因此,在为这些游戏创建和打印图形到控制台时,我认为我应该执行以下操作: 1)在记事本等文本编辑器中设计关卡等;2) 将这些文件保存为 Unicode 编码的 txt 文件,因为它们包含扩展的 ASCII;3)让我的游戏程序从这些文件中读取图形并将它们逐字打印到控制台。这对我来说似乎是一个不错的计划,除了有一个问题。

对于我的生活,我无法让程序正确输出扩展的 ASCII 字符。通常发生的情况是,程序似乎将文件中的每个单个字符作为一对 ASCII 字符读取。例如,字符 '☺' 将输出为“&;”,或类似的东西。

在 C++ 和/或 C# 中,如何正确地将 Unicode 编码的 txt 文件中的扩展 ASCII 字符逐行读取到程序中并将这些行输出到控制台窗口?

(我的意思是,我想我可以制作一个翻译函数,接收损坏的字符对,如“&;”,并将其转换回单个 ASCII 字符,如“☺”,通过一个大的 ol' if-then语句或一些巧妙推导的数学公式,但我不仅很懒,我也非常想知道 C++/C# 如何处理带有非 ANSI 编码的 txt 文件的文件 I/O,如果它们确实有这样的机制实施的!)

0 投票
1 回答
4268 浏览

ruby - 通过 bash 和 Telnet 发送不可打印的 ASCII 代码(如 0x80)

我正在尝试通过 telnet 将不可打印的 ASCII 字符(代码 128 - 255)发送到使用 Socket 对象读取数据的 Ruby 应用程序。

当我尝试\x80通过 telnet 发送时,我希望 Ruby 收到一个 3 字节的字符串:128 13 10.

我实际上收到一个 6 字节的字符串:92 120 56 48 13 10.

我是否需要更改 telnet 发送信息的方式或 Ruby 套接字如何接受信息?我已经阅读了所有我能理解的 telnet 术语。非常感谢正确方向的一点。

0 投票
1 回答
684 浏览

java - 当页面代码未知时,如何从扩展 ASCII 转换为 EBCDIC,反之亦然

我有两个数组用于从 ASCII 转换为 EBCDIC,反之亦然。上下文是:有一个 MyMainframeApp 在 UNIX 中运行,它只发送/接收 EBCDIC 中的文件。此类文件必须以 ASCII 格式从 MyWebApp 中读取、处理并以 EBCDIC 格式返回。接下来的两个数组完美地满足了转换。问题是现在我需要支持扩展 ASCII(请参阅我从互联网上获得的最后一个数组),所以我想将 EXTENDED_Array 加入 ASCII[]。EBCDIC 中的等效代码是什么?应用程序必须在 Windows 2012/JDK 6 和 Unix/JDK 6 中运行。如果我不知道页面代码,是否有安全的方法来执行此操作?注意:我不是在问如何从 ASCII 转换为 EBCDIC(这个问题在这个论坛上有很好的答案)。首先,我想把“EXTENDED”放在现场

//EBCDIC J1644 示例€ [1] [1]1240üÐB„aà[1][1] [1]1240üÐB„aà[1][1] 890@@0482613 @1644€ € @ [1]

//我想在这里添加我正在使用的解决方案并且它正在工作。虽然这不是我的原始问题的 100% 答案,但我希望这对未来的读者有用。翻译从http://www.flounder.com/ebcdictoascii2.htm复制

私有最终 int EBCDIC[] = {

私有最终 int ASCII [] = {

0 投票
2 回答
1571 浏览

oracle - 如何在 oracle 中打开(CSV)文件并将其保存为 UTF-8 格式(如果它是其他格式)

任何人都可以就以下问题给我建议。我有一个 oracle 程序,它将以 .CSV 文件作为输入并对其进行处理。我们现在面临一个问题,当输入文件中出现扩展的 ASCII 字符时,它会修剪该特殊字符之后的下一个字母。

我们正在使用 File 实用程序函数Utl_File.Fopen_Nchar()来打开文件并Utl_File.Get_Line_Nchar()读取文件中的字符。该程序的编写方式应处理输入文件中的多种语言(Unicode 字符)。

在分析中发现,当 CSV 文件的字符编码为 UTF-8 时,即使存在扩展的 ASCII 字符和 Unicode 字符,它也能成功处理文件。但有时我们会以1252(ANSI - Latin I)格式获取文件,这会导致扩展 ASCII 字符的修整问题。

那么有没有办法处理这个问题呢?如果它是任何其他格式,我们可以在 oracle 中打开一个(CSV)文件并将其保存为UTF-8格式吗?如果需要更多信息,请告诉我。

感谢期待。

0 投票
1 回答
904 浏览

swift - swift中的符号-xcode 6

我在我的应用程序中插入了几个符号,其中一些符号正确显示,但其中一些只出现了一个带脸的正方形,我是否需要添加任何框架才能正确显示所有这些符号? 在此处输入图像描述