问题标签 [non-printable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2331 浏览

lua - Lua:在字符串中查找十六进制值

我正在尝试使用 Lua 在字符串中查找十六进制不可打印字符 00h。我用转义字符尝试了它,结果我得到了我开始的相同位置(那是一个可打印的字符)。我摆弄了角色类,但这并没有什么意义。我的方法如下所示:

我也尝试过这种方式,但没有运气:

如何在 Lua 中找到这种不可打印的模式?

0 投票
2 回答
1351 浏览

java - 过滤Java中用户字体中缺少的字符

我想用 Java 构建一个稍微简单的表(作为练习)来检查最终用户字体中是否存在合法的可打印 Unicode 代码点。因为某些字体无法打印有效的代码点,我必须知道用户的字体仍然丢失了哪些可打印的代码点,因此无法打印。

例如,如果字体只支持拉丁字符,我无法使用它打印希腊字符,更不用说日文字符了。Unicode 表示它们都是可打印的,但用户的字体可能不够好。

经过一番研究,我已经能够在 Eclipse 中打印大部分字符(通过调整编码)。但是,我的输出中仍然有一堆未知/不可打印的字符,因为当我查看输出时,我会看到所有这些空矩形用于我的一些可打印字符。

我试过过滤它们,但找不到任何方法。仅供参考,我基本上只是将字符的值设置为 50、100 或 1000,然后通过for循环从那里增加它以检查我可以或不能(或不应该)打印哪些字符。

谁能给我一些关于从哪里开始的提示?

0 投票
1 回答
2056 浏览

bash - Cygwin 抓取不可打印的字符

Grepping 不可打印字符似乎不适用于回车(控制键 ^M)。

0 投票
1 回答
594 浏览

regex - 为什么 POSIX “可打印字符”类与简单字符串不匹配?

我编写了以下脚本来测试“可打印字符”字符类,如此所述。

我希望这个脚本能够输出found a printable character,其中至少一个(实际上是所有)字符"foo"是可打印的。相反,它输出"found no printable characters". 为什么中的字符"foo"不能被识别为可打印字符?

0 投票
2 回答
12837 浏览

mysql - 从 mysql 的列中删除所有或特定的不可打印字符

我想从我的 mysql 列中删除所有 OR 特定的不可打印字符。我认为这可以使用regexp_replace() 函数来实现,但我不知道。不可打印字符的 Ascii 值从 o 到 31。我有一种解决方案,如下所示:如果我编写一个从输入字符串中读取所有字符并转换为 ASCII 的函数。然后每次我将此 Ascii 值与输入的 ascii 值进行比较,如果匹配则替换它,我的函数将返回替换字符串。但是在我的应用程序中,数据总是批量的,所以我认为即使我使用选择查询和我的用户定义函数,它也会消耗很多时间来处理。所以我想要替代方法来执行这项任务。我认为regexp_replace()会很棒,但我不知道如何使用它

请帮忙

谢谢你,罗纳克

0 投票
1 回答
359 浏览

sql - SSIS将转义字符转换为asc(不可打印字符)

我使用 SSIS 将一些 csv 文件(来自 UNIX)迁移到 SQL 中。一个 csv 文件包含如下数据:

ID、名称、描述

1,12345\t,12345\177

如果 Name 或 Desc 的架构必须是 varchar(6),则迁移将失败,因为不可打印字符显示为 \t、\177...

如何将转义字符转换为 SSIS 中的不可打印字符?

\t 到 Char(9)

\177 到 Char(127)

有更好的解决方案吗?

0 投票
3 回答
1556 浏览

perl - PERL 计算不可打印字符

我有 100,000 个文件要分析。具体来说,我想从任意大小的文件样本中计算可打印字符的百分比。其中一些文件来自大型机、Windows、Unix 等,因此很可能包含二进制和控制字符。

我从使用 Linux 的“文件”命令开始,但它没有为我的目的提供足够的细节。以下代码传达了我想要做的事情,但并不总是有效。

这是一个有效的测试调用:

这就是我打算调用它的方式,并且适用于一个文件:

这不能正常工作:

这也不是:

它不是为查找返回的每一行执行一次脚本,而是为所有结果执行一次。

提前致谢。


迄今为止的研究:

管道和 XARGS 以及分隔符

http://help.lockergnome.com/linux/help-understand-pipe-xargs--ftopict549399.html

http://en.wikipedia.org/wiki/Xargs#The_separator_problem


澄清:
1.) 所需输出:如果目录中有 932 个文件,则输出将是 932 行文件名列表、从文件读取的总字节数和可打印字符的百分比。
2.) 许多文件是二进制文件。脚本需要处理嵌入的二进制eoleof序列。
3.)许多文件很大,所以我只想读取第一个/最后一个 xx 字节。我一直试图分别使用head -c 256tail -c 128读取前 256 个字节或后 128 个字节。解决方案可以在管道中工作,也可以在 perl 脚本中限制字节。

0 投票
2 回答
469 浏览

python - 避免 Python 编写的 html 文件中出现不可打印的字符

我正在尝试将 SPSS 语法文件转换为可读的 HTML。除了将(单个)不可打印字符插入到 HTML 文件中之外,它几乎可以完美地工作。它似乎没有 ASCII 码,看起来像一个小点。它正在造成麻烦。

它(仅)出现在 HTML 文件的第二行,始终对应于原始文件的第一行。这可能暗示了 Python 的哪一行导致了问题(请参阅评论)

似乎导致这种情况的代码是

结果的屏幕截图

在此处输入图像描述

0 投票
2 回答
2490 浏览

c - 带有不可打印字符的输入字符串

在 Linux 控制台中,当 C 程序要求输入字符串(即用户名)时,我如何插入不可打印的字符?
然后我搜索更好的东西,
printf '\x48\x83\xc4\x50\x48\xbf\x3d...etc' | ./myProgram.bin
或者
./myProgram.bin < dataFile
我更喜欢在需要时输入字符,但我不知道如何编写不可打印的字符。
谢谢

0 投票
1 回答
2156 浏览

string - Outlook VBA -- 修剪不可打印的字符

我在试图将字符串绑定到我在 Outlook VBA 中需要的内容时遇到了真正的困难。我已经尝试了来自互联网各地的 100 种不同的东西,包括这里。

我使用以下内容:

CCMark = "C/"

但由于邮件正文包含:C/test C/,变量 (CString) 转到“test”。

我尝试过使用带有 Trim、RTrim、LTrim、Trim$、LTrim$ 和 RTrim$ 的第二个变量。此外,我尝试过用双空格和单空格替换。我已经尝试过在互联网上流行的 TrimAll 函数,它试图找到不同的 Chr() 值以及 vbTab 等。这些似乎都不能替代任何东西。

字符串保持不变。

这是固定长度与可变长度(“相当大”)的字符串问题吗?我还没有找到从固定长度转换为变量的方法。传递一个函数没有奏效。

关于如何得出“测试”结果的任何建议?

非常感谢您的帮助。