这是上一个关于在 bash 中使用 XPath 的问题的后续。
我有一组 XML 文件,其中大部分对与其他文件的关系进行编码:
<file>
<fileId>xyz123</fileId>
<fileContents>Blah blah Blah</fileContents>
<relatedFiles>
<otherFile href='http://sub.domain.abc.edu/directory/index.php?p=collections/pageview&id=1234'>
<title>Some resource</title>
</otherFile>
<otherFile href='http://sub.domain.abc.edu/directory/index.php?p=collections/pageview&id=4321'>
<title>Some other resource</title>
</otherFile>
</relatedFiles>
</file>
上一个问题的答案帮助我成功处理了这些文件中的大部分。但是,该集合中有一些文件不包含任何relatedFiles/otherFile
元素。我希望能够单独处理这些文件并将它们移动到“其他”文件夹中。我以为我可以使用 XPathnot()
函数来执行此操作,但是当我运行脚本时,我收到该行的“找不到命令”错误。
#!/bin/bash
mkdir other
for f in *.xml; do
fid=$(xpath -e '//fileId/text()' "$f" 2>/dev/null)
for uid in $(xpath -e '//otherFile/@href' "$f" 2>/dev/null | awk -F= '{gsub(/"/,"",$0); print $4}'); do
echo "Moving $f to ${fid:3}_${uid}.xml"
cp "$f" "${fid:3}_${uid}.xml"
done
if $(xpath -e 'not(//otherFile)' "$f" 2>/dev/null); then
echo "Moving $f to other/${fid:3}.xml"
cp "$f" "other/${fid:3}.xml"
fi
rm "$f"
done
如何在 bash 中使用 XPath 过滤掉不包含某些元素的文件?提前致谢。