11

似乎 bash 和 dash 从我的脚本中过滤掉任何 ASCII NUL。

$ printf 'test="\000a" ; echo ${#test}' | sh
1
$ printf 'test="\001a" ; echo ${#test}' | sh
2
$ printf 'ec\000ho test' | sh
test
$ # (Same for bash)

虽然我同意使用 NUL 是一个坏主意(例如,传递给程序的参数适用于 NUL 终止的字符串),但我看不出POSIX 标准在哪里认可这种行为。

当这种行为决定文件的语法正确性时,情况会变得更糟。

$ printf 'echo "\\\000"' | sh
sh: Syntax error: Unterminated quoted string
$ printf 'echo "\\\000"' | bash
bash: line 1: unexpected EOF while looking for matching `"'
bash: line 2: syntax error: unexpected end of file
$ printf 'echo "\\\134"' | sh
\

我错过了哪些重要部分,或者 NUL 删除只是关于如何应对未指定行为的决定?

4

1 回答 1

6

sh标准中的 INPUT FILES 部分指出:

输入文件应为文本文件,但行长不受限制。如果输入文件为空或仅由空行或注释组成,或两者兼而有之,则 sh 将以零退出状态退出。

术语“文本文件”在此处的第 3.395 节中定义为:

包含组织成零行或多行的字符的文件。这些行不包含 NUL 字符,长度不能超过 {LINE_MAX} 个字节,包括 <newline> 字符。尽管 POSIX.1-2008 不区分文本文件和二进制文件(参见 ISO C 标准),但许多实用程序仅在对文本文件进行操作时产生可预测或有意义的输出。具有此类限制的标准实用程序始终在其 STDIN 或 INPUT FILES 部分中指定“文本文件”

如果输入不是文本文件(如果它包含零字节则不是),则该行为既没有意义也无法预测。

于 2012-08-09T14:09:20.993 回答