0

IFS在 shell 脚本中使用变量来解析一些数据(数据已经以给定的格式提供给我)。由于默认的 IFS 是空格/制表符/等,我使用该字符'¬'来分隔输入文件行中的字段。数据类似于

14352345¬AFSFDG1234¬text¬(http://www.google.com,3)(http://www.test.com,2)¬(www.test2.com,4)¬123-23432

我创建了一个脚本,该脚本使用 IFS 变量将文件通过管道传输到 while 循环中:

#!/bin/bash;
while IFS=¬ read -r sessionId qId testResults realResults queryId;
do echo $sessionId; done < inputFile

(在这个循环中,我实际上对另一个文件进行了一些 awk 处理)。

发生的情况是,如果我手动运行此文件(仅 ./file),它会完美运行。如果我将它作为脚本(cron)的一部分或在另一个脚本中运行,我会收到解析错误,这表明我的 IFS 变量没有被使用。我尝试过复制旧的 IFS 变量并在解析后重置以及传递 IFS 变量的不同方式(¬, '¬',$'¬'等,但似乎没有帮助)。

任何指针/提示将不胜感激。


更新:经过一些额外的调试,问题出在 awk 语句而不是分隔符上

4

1 回答 1

5

您可能遇到了 Unicode 问题,或者您尝试使用的 shell 有问题,前者更有可能。

您选择作为分隔符 ( ¬) 的字符在 ASCII 集之外,并且可以(通常)由计算机以两种不同的方式表示:将其编码为 latin1 或类似的字符,其中字符占用一个八位字节,或者它'将被编码为 UTF-8 并使用两个八位字节。还有其他可能,但这两种可能性最大,请耐心等待。

如果您保存了编码为 UTF-8 的脚本并且您尝试在非 unicode 语言环境中运行它,则 shell 将获得两个(错误)字符作为分隔符,而不是一个。要对此进行测试,请尝试使用 ascii 字符作为分隔符,~例如。

如果您发现 using~有效,则必须查看系统的全局配置,并确保区域设置在您用于创建脚本的环境中相同,就像在脚本运行。您可以执行此locale命令。您可以创建一个脚本来运行此命令并将其输出存储在一个文件中:

#!/bin/sh
locale > /tmp/locale-env

然后,例如,让它从 cron 运行,并查看/tmp/locale-env文件。将其内容与locale您从交互式 shell 运行时的输出进行比较。/etc/environment根据您的发行版,您可能能够在/etc/profile或其他位置设置您的全球语言环境。您可能希望在系统范围内使用 UTF-8:

LANG=en_US.UTF-8
export LANG

这是一个我们国际用户往往比说英语的用户更了解的陷阱,因为 ASCII 和 UTF-8 对于英文字符是完全相同的,而且这些问题往往被忽视。

于 2011-03-07T09:47:06.047 回答