我有文件file1
包含
123 foo
45 bar
678 foobar
...
并file2
包含
xyz
foo
foobar
...
我想获得一个文件,其中只有file1
第二列出现在的行file2
:
123 foo
678 foobar
...
列由制表符分隔。如果可能,我想从 Mac OS X 命令行运行它。
这绝对是一份工作join
:
$ join -1 2 -2 1 <(sort file) <(sort file2)
foo 123
foobar 678
使用 Perl:
use strict;
use warnings;
my %seen;
open (my $input2, "<", "input2") or die("open input2: $!");
while (<$input2>) { chomp; $seen{$_}++; }
close $input2;
open (my $input1, "<", "input1") or die("open input1: $!");
while (<$input1>) {
chomp;
my $key = (split (/\s+/))[1];
print "$_\n" if $seen{$key};
}
close $input1;
或者您可以使用join
and执行此操作sort
:
sort input2 > input2sorted
join -1 2 -2 1 input1 input2sorted
此外,下次您可以发布您对该问题的看法并提出更具体的问题。
试试这个 :
grep -f file2 file1 > Output.txt
文件 1
123 foo
45 bar
678 foobar
文件2
xyz
foo
foobar
输出.txt
123 foo
678 foobar
这是一种使用方法awk
:
awk -F "\t" 'FNR==NR { a[$0]++; next } $2 in a' file2 file1
结果:
123 foo
678 foobar
这是一个使用File::Slurp读取文件的 perl 选项。 map
用于使用“键”初始化散列,grep
如果条目在散列中,则正则表达式获取用于仅通过匹配行的最后一列条目:
use strict;
use warnings;
use File::Slurp qw/read_file/;
my %keys = map { chomp; $_ => 1 } read_file 'file2.txt';
print for grep { /\t(.+)$/; $keys{$1} } read_file 'file1.txt';
数据集的输出:
123 foo
678 foobar