4

我有两个文件。文件A有一个单词列表,每行一个。文件B包含另一个巨大的单词列表,但有些很长。我将如何使用 sed 或 awk 从文件中获取每一行A并将其与文件B中不超过 6 个字符的每一行结合起来?理想情况下,它会在一个新文件中吐出所有结果。

例如:

档案一:

cool
beans
sad

文件 B:

armadillo
snake
bread

新文件:

coolsnake
coolbread
beanssnake
beanbread
sadsnake
sadbread
4

5 回答 5

4

与您的输出顺序不同,但可能有用:

awk '
  FNR == NR { 
    words[ $1 ] = 1; 
      next 
  } 
  FNR < NR { 
    if ( length( $1 ) <= 6 ) 
      for ( word in words ) { 
        print word $0 
       } 
  }
' fileA fileB

输出:

coolsnake
sadsnake
beanssnake
coolbread
sadbread
beansbread
于 2012-04-24T19:19:47.177 回答
3

这可能对您有用:

sed 's|.*|sed "/......./d;s/.*/&\&/" fileB|' fileA | sh

使用 GNU sed:

sed 's|.*|sed "/......./d;s/.*/&\&/" fileB|e' fileA
于 2012-04-24T20:39:18.193 回答
2
#!/bin/bash

while read line1; do
 while read line2;do
   [[ $(echo $line2 | wc -c) -lt 7 ]] && \
   echo $line1$line2
 done < './B.txt'
done < './A.txt'

类似的东西,只是适合自己,它给了我:

coolsnake
coolbread
beanssnake
beansbread
sadsnake
sadbread
于 2012-04-24T19:26:41.653 回答
1

一种使用方式perl

内容script.pl

use warnings;
use strict;

die qq[Usage: perl $0 <fileA> <fileB>\n] unless @ARGV == 2;

open my $fh, q[<], pop or die $!;

my @words = map { chomp; $_ } grep { length( $_ ) <= 6 } <$fh>;

while ( <> ) {
    chomp;
    for my $word ( @words ) {
        printf qq[%s\n], $_ . $word;
    }
}

像这样运行它:

perl script.pl fileA fileB 

具有以下输出:

coolsnake
coolbread
beanssnake
beansbread
sadsnake
sadbread
于 2012-04-24T19:49:00.110 回答
1

用 bash:

mapfile -t shortwords < <(sed -r 's/.{7,}/d' B.txt)
while read word; do
  for suffix in "${shortwords[@]}"; do
    echo "$word$suffix"
  done
done < A.txt
于 2012-04-24T19:52:38.953 回答