5

在 cygwin 中,以下代码可以正常工作

$ cat junk
bat
bat
bat

$ cat junk | sort -k1,1 |tr 'b' 'z' > junk

$ cat junk
zat
zat
zat

但是在linux shell(GNU/Linux)中,覆盖似乎不起作用

[41] othershell: cat junk
cat
cat
cat
[42] othershell: cat junk |sort -k1,1 |tr 'c' 'z'
zat
zat
zat
[43] othershell: cat junk |sort -k1,1 |tr 'c' 'z' > junk
[44] othershell: cat junk

两种环境都运行 BASH。

我问这个是因为有时在我进行文本操作之后,由于这个警告,我不得不制作 tmp 文件。但我知道在 Perl 中,您可以在一些操作/操作后给出“i”标志来覆盖原始文件。我只是想问一下unix管道中是否有任何万无一失的方法来覆盖我不知道的文件。

4

5 回答 5

9

这里有四个要点:

  1. “猫没用。” 不要那样做。
  2. 您实际上并没有使用 sort 对任何内容进行排序。不要那样做。
  3. 您的管道没有说出您认为的内容。不要那样做。
  4. 您试图在读取文件时就地覆盖文件。不要那样做。

您获得不一致行为的原因之一是您正在管道到具有重定向的进程,而不是重定向整个管道的输出。区别很微妙,但很重要。

您想要的是使用Command Grouping创建一个复合命令,以便您可以重定向整个管道的输入和输出。在您的情况下,这应该可以正常工作:

{ sort -k1,1 | tr 'c' 'z'; } < junk > sorted_junk

请注意,如果没有任何要排序的内容,您也可以跳过排序命令。然后您的命令可以在不需要命令分组的情况下运行:

tr 'c' 'z' < junk > sorted_junk

保持重定向和管道尽可能简单。它使调试脚本变得更加容易。

但是,如果您出于某种原因仍想滥用管道,则可以使用moreutils包中的海绵实用程序。手册页说:

海绵读取标准输入并将其写入指定文件。与 shell 重定向不同,海绵在打开输出文件之前会吸收所有输入。这允许限制读取和写入同一文件的管道。

因此,您的原始命令行可以像这样重写:

cat junk | sort -k1,1 | tr 'c' 'z' | sponge junk

并且由于在海绵从管道接收到 EOF 之前不会覆盖垃圾,因此您将获得预期的结果。

于 2012-05-14T20:38:52.403 回答
7

一般来说,这可能会被打破。管道中的进程都是并行启动的,因此> junk行尾的通常会在流水线头部的进程完成(甚至开始)读取输入文件之前截断输入文件。

即使 Cygwin 下的 bash 让你摆脱了这个,你也不应该依赖它。一般的解决方案是重定向到一个临时文件,然后在管道完成时重命名它。

于 2012-05-14T15:48:43.997 回答
3

你想编辑那个文件,你可以使用编辑器。

ex junk << EOF
%!(sort -k1,1 |tr 'b' 'z')
x
EOF
于 2012-05-14T23:09:45.523 回答
0

在管道中覆盖相同的文件不是建议,因为当你犯了错误时,你无法取回它(除非你有备份或者它是受版本控制的)。

发生这种情况是因为管道中的输入和输出是自动缓冲的(这给您一个有效的印象),但实际上它是并行运行的。不同的平台可以以不同的方式缓冲输出(基于设置),所以在一些平台上你最终会得到空文件(因为文件将在开始时创建),在另一些平台上会有半成品文件。

解决方案是在文件仅在遇到具有完整缓冲和处理输入的 EOF 时才被覆盖时使用某种方法。

这可以通过以下方式实现:

  • 使用可以在打开输出文件之前吸收所有输入的实用程序。

    这可以通过sponge(与unbufferfrom expectpackage 相反)来完成。

  • 避免使用 I/O 重定向语法(它可以在启动命令之前创建空文件)。

    例如使用tee(缓冲其标准流),例如:

    cat junk | sort | tee junk
    

    这仅适用于sort,因为它希望所有输入都处理排序。因此,如果您的命令不使用sort,请添加一个。

    可以使用的另一个工具是stdbuf修改其标准流的缓冲操作,您可以在其中指定缓冲区大小。

  • 使用可以就地编辑文件的文本处理器(例如sedex)。

    例子:

    $ ex -s +'%!sort -k1' -cxa myfile.txt
    $ sed -i '' s/foo/bar/g myfile.txt
    
于 2015-04-20T11:15:43.027 回答
0

使用下面的简单脚本,你可以让它像你想要的那样工作:

$ cat junk | sort -k1,1 |tr 'b' 'z' | overwrite_file.sh junk

覆盖文件.sh

#!/usr/bin/env bash

OUT=$(cat -)

FILENAME="$*"

echo "$OUT" | tee "$FILENAME"

请注意,如果您不希望将更新后的文件发送到标准输出,则可以改用此方法

overwrite_file_no_output.sh

#!/usr/bin/env bash

OUT=$(cat -)

FILENAME="$*"

echo "$OUT" > "$FILENAME"
于 2018-07-19T13:47:22.197 回答