79

我在linux中有一些文件。例如 2,我需要将文件改组到一个文件中。

例如

$cat file1
line 1
line 2
line 3
line 4
line 5
line 6
line 7
line 8

$cat file2
linea one
linea two
linea three
linea four
linea five
linea six
linea seven
linea eight

后来我改组这两个文件,我可以获得类似的东西:

linea eight
line 4
linea five
line 1
linea three
line 8
linea seven
line 5
linea two
linea one
line 2
linea four
line 7
linea six
line 1
line 6
4

8 回答 8

131

你应该使用shuf命令 =)

cat file1 file2 | shuf

或使用 Perl:

cat file1 file2 | perl -MList::Util=shuffle -wne 'print shuffle <>;'
于 2013-07-10T19:05:01.973 回答
51

排序:(相似的行会放在一起)

cat file1 file2 | sort -R

嘘:

cat file1 file2 | shuf

珀尔:

cat file1 file2 | perl -MList::Util=shuffle -e 'print shuffle<STDIN>'

重击:

cat file1 file2 | while IFS= read -r line
do
    printf "%06d %s\n" $RANDOM "$line"
done | sort -n | cut -c8-

呸:

cat file1 file2 | awk 'BEGIN{srand()}{printf "%06d %s\n", rand()*1000000, $0;}' | sort -n | cut -c8-
于 2013-07-10T21:36:55.943 回答
25

请注意使用 MacPorts 的 OS X 用户:该shuf命令是 name 的一部分coreutils并安装在 name 下gshuf

$ sudo port install coreutils
$ gshuf example.txt # or cat example.txt | gshuf
于 2015-05-18T11:27:30.623 回答
13

你不需要在这里使用管道。单独排序以文件作为参数来执行此操作。我会做

sort -R file1

或者如果您有多个文件

sort -R file1 file2
于 2017-12-01T11:30:28.030 回答
13

这是一个不依赖shufor的单行代码,sort -R我的 Mac 上没有它:

while read line; do echo $RANDOM $line; done < my_file | sort -n | cut -f2- -d' '

这将遍历所有行my_file并以随机顺序重新打印它们。

于 2015-11-13T02:26:34.400 回答
6

我也会用shuf

另一种选择,gnu sort 有:

   -R, --random-sort
          sort by random hash of keys

你可以试试:

cat file1 file2|sort -R
于 2013-07-10T20:06:03.940 回答
1

这对我有用。它采用了 Fisher-Yates 洗牌。

randomize()
{   
    arguments=("$@")
    declare -a out
    i="$#"
    j="0"

while [[ $i -ge "0" ]] ; do
    which=$(random_range "0" "$i")
    out[j]=${arguments[$which]}
    arguments[!which]=${arguments[i]}
    (( i-- ))
    (( j++ ))
done
echo ${out[*]}
}


random_range()
{
    low=$1
    range=$(($2 - $1))
    if [[ range -ne 0 ]]; then
        echo $(($low+$RANDOM % $range))
    else
        echo "$1"
    fi
}
于 2015-06-18T05:57:09.693 回答
0

这显然是有偏见的 rand (就像列表从第一行开始的一半时间)但是对于一些仅使用 bash 内置函数的基本随机化,我想这很好吗?只需打印每一行是/否,然后打印其余的...

shuffle() {
    local IFS=$'\n' tail=
    while read l; do
        if [ $((RANDOM%2)) = 1 ]; then
            echo "$l"
        else
            tail="${tail}\n${l}"

        fi
    done < $1
    printf "${tail}\n"
}
于 2018-06-12T16:04:58.670 回答