问题标签 [non-printing-characters]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
205 浏览

php - 删除不可打印的字符但保留重音符号(PHP 5.5 到 5.6 问题)

我想删除不可打印的字符并保留像“é”这样的法语口音。我可以在 PHP 5.5 中做到这一点,但在 PHP 5.6 中却不行。

在 PHP 5.5 上:

这完美地工作。但是自从我升级到 PHP 5.6 后,它返回一个空白值!

在 PHP 5.6 上,我使用这个部分修复:

不可打印的字符被删除,但重音符号也被删除。我怎样才能保留它们?

当变量保存到 SQL 时,我想要“mangé”,但它在 PHP 5.6 上返回“mang”。

感谢帮助 !

0 投票
4 回答
23503 浏览

bash - 尝试从 UNIX 文件中删除不可打印的字符(垃圾值)

我正在尝试^@从我的文件中的记录中删除不可打印的字符(例如)。由于文件中的记录量太大,因此使用 cat 不是一个选项,因为循环花费了太多时间。我尝试使用

但仍然^@没有删除字符。我也尝试使用

但这也无济于事。

有人可以建议一些替代方法来删除不可打印的字符吗?

已使用tr -cd,但它正在删除重音字符。但它们在文件中是必需的。

0 投票
3 回答
344 浏览

c# - 删除不可打印的字符串

我已经对 pdf 图像进行了 OCR 并提取了文本。由于某种原因,OCR 已将单个空格转换为双回车换行。

例如。

以下不起作用,因为我认为我的 4 个字符并不是真正的搅拌,而是 4 个不可打印的字符。

我只想在它们一起出现时用空格替换这 4 个不可打印的字符。

怎么能不费吹灰之力就做到这一点。

0 投票
1 回答
2611 浏览

utf-8 - 如何创建名称中包含非打印字符的文件?

我遇到了文件被上传到文件名中包含非打印 UTF-8 字符的服务器的情况。我知道如何修复名称,但我希望能够创建用于测试的文件,并且我还想了解人们可能会如何意外(或有意)首先这样做。

那么,考虑到这一点,人们可以通过哪些可能的方式创建包含非打印字符的文件名?在这种情况下,它是 DELETE (U+007F),但我对任何非打印字符都感兴趣。

我正在寻找易于在命令行(linux、unix 和 DOS)上有意完成的方法,以及人们可能通过命令行或 GUI(windows、OSX、linux)意外执行此操作的方法。

0 投票
1 回答
152 浏览

character-encoding - Match non breaking space in Rascal

In Rascal, how can I match a non breaking space in a syntax definition? I found some of them in code I am trying to analyze and would like to recognize it as layout.

However, just pasting the character into the Rascal file is not working (with or without escaping by prefixing with a backslash), nor are "\uc2a0" "\uC2A0", while "c2a0" really is the way the character is coded in the file I am reading (according to the Hex Viewer plugin for Sublime Text 3, that is).

0 投票
1 回答
326 浏览

java - 如何使用 uniVocity-parsers 处理不可打印字符

我想将 Java 与uniVocity-parsers一起使用来解析 mysql 生成的 csv 数据select into outfile

现在遇到一种处理不可打印字符的情况!mysql 表包含bit(1)列,当使用select into outfile将其数据保存到文件中时,我发现bit(1)列数据变为不可打印字符。当使用uniVocity-parsers获取行数据时,我得到nullbit(1)列的值。我希望得到该bit(1)列的真实数据。我该怎么办 ?

0 投票
2 回答
2161 浏览

html - 在 html textarea 中显示不可打印的字符

我有一个文本区域,其内容显示如下:

文本区域

我希望它显示的也是不可打印的字符,例如空格和换行符(截图以 libre office 为例):

自由办公室的例子

这可以在文本区域中显示这样的不可打印字符吗?

0 投票
1 回答
181 浏览

c++ - TCP 是否支持不可打印的字符?

我是 TCP/IP 协议的新手,想用 C++ 创建一个聊天服务器。

现在,我决定以一个字符开始我的所有传输,以告知接下来会发生什么(登录请求、要发布的消息、客户的用户名……)。

因此,我使用 0x01、0x02、... 等值来表示与登录、信息请求等相关的内容,而 0x10 则用于消息。

绝望地,当我尝试用我创建的另一个程序连接到我的服务器时,我从服务器收到一个传输,它以 0x01 开头(所以一切都还可以),但是当我回复以 0x03 开头的东西时,服务器只有当我杀死客户时收到它...

我认为是 select 函数并没有说有什么要读的。

这正常吗?

如果是,我应该用可打印且没有特殊含义的值替换这些值吗?

0 投票
1 回答
138 浏览

c - 当 \t 在 C 中遇到 \b 时会发生什么?

我知道是什么\t意思\b
但是当 a\b在 a 之后\t会发生什么,以及当 multiple\b\tcombine 会发生什么。
看这段代码,它包含了\t和的多种组合\b

我有:

两者\b显示方式不同。
结果令人困惑,以我现有的知识根本无法解释。
我不知道怎么理解\t\b到底。

0 投票
1 回答
203 浏览

java - UTF-8 的不可打印字符 - SUSE Linux Java 不支持

我们正在实施一项功能,以支持我们的数据库中的 UTF-8 不可打印字符。我们的系统将它们存储在数据库中并检索它们。我们以 base 64 的形式收集输入,将它们转换为字节数组并存储在数据库中。在检索过程中,数据库为我们提供了字节数组,我们再次将它们转换为 base 64。

在检索过程中(在 db 给我们字节数组之后),所有属性都转换为字符串数组,然后它们再次转换回字节数组,并再次转换为 base 64 以将其返回给用户。

以下代码在我们的 Windows JDK(Java 8 版本)中编译并正常工作。但是当这个放在SuSe Linux环境中时,我们看到了奇怪的字符。

给出的输出是

"字符串是 ªºÊÚú"

现在,当在 SuSe Linux 发行版上运行相同的文件时,它给了我:

“字符串是������”

我们在 Windows 和 Linux 中都使用 Java 8。它在Linux中无法正常执行的问题是什么?

我们也试过了 utfString = new String(attributeValues,"UTF-8");。它没有任何帮助。我们缺少什么?