10

我正在使用以下 shell 脚本将一个文件的内容查找到另一个文件中:

#!/bin/ksh
file="/home/nimish/contents.txt"

while read -r line; do
    grep $line /home/nimish/another_file.csv
done < "$file"

我正在执行脚本,但它没有显示 CSV 文件中的内容。我的 contents.txt 文件也包含CSV 文件中存在的数字,例如"08915673"或。"123223"我的所作所为有什么问题吗?

4

3 回答 3

32

grep本身是能够做到的。只需使用标志-f

grep -f <patterns> <file>

<patterns>是每行包含一个模式的文件;并且<file>是您要在其中搜索内容的文件。

请注意,要强制grep将每一行视为一个模式,即使每一行的内容看起来像一个正则表达式,您也应该使用 flag -F, --fixed-strings

grep -F -f <patterns> <file>

如果您的文件是 CSV,如您所说,您可以这样做:

grep -f <(tr ',' '\n' < data.csv) <file>

例如,考虑文件“a.txt”,其中包含以下几行:

alpha
0891234
beta

现在,文件“b.txt”,包含以下行:

Alpha
0808080
0891234
bEtA

以下命令的输出是:

grep -f "a.txt" "b.txt"
0891234

你根本不需要在for这里循环;grep本身就提供了这个功能。


现在使用您的文件名:

#!/bin/bash
patterns="/home/nimish/contents.txt"
search="/home/nimish/another_file.csv"
grep -f <(tr ',' '\n' < "${patterns}") "${search}"

您可以更改','为文件中的分隔符。

于 2013-02-25T03:02:27.480 回答
2

另一种解决方案:

  • 使用awk和创建您自己的hash(例如 ahash),全部由您自己控制。
  • 替换$0 to $i,您可以匹配您想要的任何字段。

awk -F"," '
{  
   if (nowfile==""){ nowfile = FILENAME;  }

   if(FILENAME == nowfile)
   {
     hash[$0]=$0;
   }
   else
   {
       if($0 ~ hash[$0])
       {  
           print $0
       }
   }
} '  xx yy
于 2013-02-25T10:07:51.280 回答
1

我不认为你真的需要一个脚本来执行你正在尝试做的事情。

一个命令就够了。就我而言,我需要 CSV 文件的第 11 列中的标识号(使用“;”作为分隔符):

grep -f <(awk -F";" '{print $11}' FILE_TO_EXTRACT_PATTERNS_FROM.csv) TARGET_FILE.csv

于 2017-09-08T18:09:31.987 回答