问题标签 [non-printing-characters]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 删除不可打印的字符但保留重音符号(PHP 5.5 到 5.6 问题)
我想删除不可打印的字符并保留像“é”这样的法语口音。我可以在 PHP 5.5 中做到这一点,但在 PHP 5.6 中却不行。
在 PHP 5.5 上:
这完美地工作。但是自从我升级到 PHP 5.6 后,它返回一个空白值!
在 PHP 5.6 上,我使用这个部分修复:
不可打印的字符被删除,但重音符号也被删除。我怎样才能保留它们?
当变量保存到 SQL 时,我想要“mangé”,但它在 PHP 5.6 上返回“mang”。
感谢帮助 !
bash - 尝试从 UNIX 文件中删除不可打印的字符(垃圾值)
我正在尝试^@
从我的文件中的记录中删除不可打印的字符(例如)。由于文件中的记录量太大,因此使用 cat 不是一个选项,因为循环花费了太多时间。我尝试使用
但仍然^@
没有删除字符。我也尝试使用
但这也无济于事。
有人可以建议一些替代方法来删除不可打印的字符吗?
已使用tr -cd
,但它正在删除重音字符。但它们在文件中是必需的。
c# - 删除不可打印的字符串
我已经对 pdf 图像进行了 OCR 并提取了文本。由于某种原因,OCR 已将单个空格转换为双回车换行。
例如。
以下不起作用,因为我认为我的 4 个字符并不是真正的搅拌,而是 4 个不可打印的字符。
我只想在它们一起出现时用空格替换这 4 个不可打印的字符。
怎么能不费吹灰之力就做到这一点。
utf-8 - 如何创建名称中包含非打印字符的文件?
我遇到了文件被上传到文件名中包含非打印 UTF-8 字符的服务器的情况。我知道如何修复名称,但我希望能够创建用于测试的文件,并且我还想了解人们可能会如何意外(或有意)首先这样做。
那么,考虑到这一点,人们可以通过哪些可能的方式创建包含非打印字符的文件名?在这种情况下,它是 DELETE (U+007F),但我对任何非打印字符都感兴趣。
我正在寻找易于在命令行(linux、unix 和 DOS)上有意完成的方法,以及人们可能通过命令行或 GUI(windows、OSX、linux)意外执行此操作的方法。
character-encoding - Match non breaking space in Rascal
In Rascal, how can I match a non breaking space in a syntax definition? I found some of them in code I am trying to analyze and would like to recognize it as layout.
However, just pasting the character into the Rascal file is not working (with or without escaping by prefixing with a backslash), nor are "\uc2a0" "\uC2A0", while "c2a0" really is the way the character is coded in the file I am reading (according to the Hex Viewer plugin for Sublime Text 3, that is).
java - 如何使用 uniVocity-parsers 处理不可打印字符
我想将 Java 与uniVocity-parsers一起使用来解析 mysql 生成的 csv 数据select into outfile
。
现在遇到一种处理不可打印字符的情况!mysql 表包含bit(1)
列,当使用select into outfile
将其数据保存到文件中时,我发现bit(1)
列数据变为不可打印字符。当使用uniVocity-parsers获取行数据时,我得到null
了bit(1)
列的值。我希望得到该bit(1)
列的真实数据。我该怎么办 ?
c++ - TCP 是否支持不可打印的字符?
我是 TCP/IP 协议的新手,想用 C++ 创建一个聊天服务器。
现在,我决定以一个字符开始我的所有传输,以告知接下来会发生什么(登录请求、要发布的消息、客户的用户名……)。
因此,我使用 0x01、0x02、... 等值来表示与登录、信息请求等相关的内容,而 0x10 则用于消息。
绝望地,当我尝试用我创建的另一个程序连接到我的服务器时,我从服务器收到一个传输,它以 0x01 开头(所以一切都还可以),但是当我回复以 0x03 开头的东西时,服务器只有当我杀死客户时收到它...
我认为是 select 函数并没有说有什么要读的。
这正常吗?
如果是,我应该用可打印且没有特殊含义的值替换这些值吗?
c - 当 \t 在 C 中遇到 \b 时会发生什么?
我知道是什么\t
意思\b
。
但是当 a\b
在 a 之后\t
会发生什么,以及当 multiple\b
和\t
combine 会发生什么。
看这段代码,它包含了\t
和的多种组合\b
:
我有:
两者\b
显示方式不同。
结果令人困惑,以我现有的知识根本无法解释。
我不知道怎么理解\t
和\b
到底。
java - UTF-8 的不可打印字符 - SUSE Linux Java 不支持
我们正在实施一项功能,以支持我们的数据库中的 UTF-8 不可打印字符。我们的系统将它们存储在数据库中并检索它们。我们以 base 64 的形式收集输入,将它们转换为字节数组并存储在数据库中。在检索过程中,数据库为我们提供了字节数组,我们再次将它们转换为 base 64。
在检索过程中(在 db 给我们字节数组之后),所有属性都转换为字符串数组,然后它们再次转换回字节数组,并再次转换为 base 64 以将其返回给用户。
以下代码在我们的 Windows JDK(Java 8 版本)中编译并正常工作。但是当这个放在SuSe Linux环境中时,我们看到了奇怪的字符。
给出的输出是
"字符串是 ªºÊÚú"
现在,当在 SuSe Linux 发行版上运行相同的文件时,它给了我:
“字符串是������”
我们在 Windows 和 Linux 中都使用 Java 8。它在Linux中无法正常执行的问题是什么?
我们也试过了 utfString = new String(attributeValues,"UTF-8");
。它没有任何帮助。我们缺少什么?