给定一个包含项目信息的制表符分隔的文本文件:
41850 0.4 0.5 LG EN RP 比利制造冰箱,标准 朋友 9338 0.4 0.5 LG EN RP 闪耀,音乐剧!芥末,上校 7255 0.5 0.5 LG EN RP 你能扮演杜鲁门吗,哈丽特 犹太人的竖琴 9314 0.5 0.5 LG EN RP 嗨,Skippy Plum,教授
请注意其中两行的“孤立”标题。使用 awk,如何将这个孤儿合并回上面的标题字段?
伪awk:
awk '/^[[:digit:]]/{getline; ???
if next line ~ /^[[:alpha:]]/ title=$7 + previous
END{print $0}' <FILE
无论如何,步骤似乎是:
任何一个
- 找到“正常”行,
- 测试以下行是否为“孤儿”
- 如果是这样,将“孤儿”附加到字段 7 [标题字段],
- 打印线
或者
- 寻找“孤儿”
- 以某种方式附加到上一行的字段 7 [永远不会有两个连续的孤儿]
第一种方法对我来说似乎最简单——但是,我是这里的无知者。