0

我的文件中有这些数据

 65 ---
 66 FieldType: Text
 67 FieldName: STATE
 68 FieldNameAlt: STATE
 69 FieldFlags: 4194304
 70 FieldJustification: Left
 71 FieldMaxLength: 2
 72 ---
 73 FieldType: Text
 74 FieldName: ZIP
 75 FieldNameAlt: ZIP
 76 FieldFlags: 0
 77 FieldJustification: Left
 78 ---
 79 FieldType: Signature
 80 FieldName: EMPLOYEE SIGNATURE
 81 FieldNameAlt: EMPLOYEE SIGNATURE
 82 FieldFlags: 0
 83 FieldJustification: Left
 84 ---
 85 FieldType: Text
 86 FieldName: Name_Last
 87 FieldNameAlt: LAST
 88 FieldFlags: 0
 89 FieldValue: Billa
 90 FieldJustification: Left
 91 ---

我怎样才能把它做成一个数组并作为键值对存储在数组中,比如

array['fieldtype']
array['fieldName']

对于所有的对象。

我认为分隔符只是“---”但我不知道我该怎么做

4

3 回答 3

1

这是使用 GNU awk 的一种方法。它将输入拆分为记录,然后可以对其进行处理。

解析.awk

BEGIN {
  RS = " +[0-9]+ +---\n"
  FS = "\n"
}

{
  for(i=1; i<=NF; i++) {             # for each line
    sf = split($i, a, ":")
    if(sf > 1) {                     # only accept successfully split lines
      sub("^ +[0-9]+ +", "", a[1])   # trim key
      sub("^ +", "",  a[2])          # trim value
      array[a[1]] = a[2]             # save into array hash
    }
  }
}

{
  print "Record: " NR
  for(k in array) {
    print k " -> " array[k]
  }
  print ""
}

将上面的内容保存到parse.awk并像这样运行它:

awk -f parse.awk infile

whereinfile包含您要解析的数据。输出:

Record: 1

Record: 2
FieldFlags -> 4194304
FieldNameAlt -> STATE
FieldJustification -> Left
FieldType -> Text
FieldMaxLength -> 2
FieldName -> STATE

Record: 3
FieldFlags -> 0
FieldNameAlt -> ZIP
FieldJustification -> Left
FieldType -> Text
FieldMaxLength -> 2
FieldName -> ZIP

Record: 4
FieldFlags -> 0
FieldNameAlt -> EMPLOYEE SIGNATURE
FieldJustification -> Left
FieldType -> Signature
FieldMaxLength -> 2
FieldName -> EMPLOYEE SIGNATURE

Record: 5
FieldFlags -> 0
FieldNameAlt -> LAST
FieldJustification -> Left
FieldType -> Text
FieldMaxLength -> 2
FieldValue -> Billa
FieldName -> Name_Last
于 2012-11-12T08:45:41.133 回答
0

你可以使用这样的东西:

sed -n '/FieldType/,/FieldName/{N};s/FieldType: \([^\n]*\)\nFieldName: \([^\n]*\)/a["\2"]=\1/gp' input >> tmp.sh

并做:

source tmp.sh

或使用eval而不是重定向和source,但是员工签名字段中的空格会导致问题。

不过,使用 Perl 更有意义。

于 2012-11-12T08:43:55.020 回答
0

在任何类型的 awk 中:

#!awk -F':[[:blank:]]*' -f
BEGIN {
    counter = 0
}
/:/ {
    array[counter,$1] = $2
}
/---/ {
    counter++;
}
END {
  # Deal with the array.
}

这将创建一个数组,其中由“计数器”计数的每个单元格都包含如上所述的字段,其中 array[x,key] = value。

于 2012-11-13T03:30:34.717 回答