2

假设目录输入中有 1000 个扩展名为 .xhtml 的文件,并且这些文件的某个子集(例如,输出路径在 $(FILES) 中)需要通过 xslt 转换为目录输出中具有相同名称的文件。一个简单的 make 规则是:

$(FILES): output/%.xhtml : input/%.xhtml
    saxon s:$< o:$@ foo.xslt

当然,这可以一次转换一个文件。问题是我想使用 saxon 的批处理一次处理所有文件,因为考虑到为每个文件加载 java 和 saxon 的开销,考虑到文件的数量,这会快得多。Saxon 允许 -s(源)选项作为目录并处理该目录中的所有文件,将具有相同名称的结果放置在 -o: 选项中指定的目录中。

我知道让 GNU make 使用模式规则执行单个命令来更新多个文件的众所周知的技术:

output/%.xhtml: input/%.xhtml
    saxon s:input -o:output foo.xslt

但就我而言,这有两个问题。首先,它将在输入目录中的所有文件上运行转换,而不仅仅是已更改的文件;其次,它不会将转换限制在 $(FILES) 中指定的文件子集。在所谓的“静态模式规则”(参见[这里])的情况下,GNU make 功能对于所有匹配的目标只运行一次模式规则中给出的配方,因为在顶部给出的规则帖子是已知的。

为了使用 saxon 批处理功能,我需要创建一个临时目录,仅将要处理的文件复制到其中,然后使用该临时目录作为输入目录运行转换。我尝试创建一个临时目录,并使用特定于目标的变量记住它的名称以备将来使用,使用

$(FILES): TMPDIR:=$(shell mktemp -d)

但这会为每个过时的目标创建一个新的临时目录。无论如何,我不确定如何构建规则,然后将必要的文件复制到该目录中。我不想在解析 makefile 时创建临时目录,因为我有一个非递归的 make 系统,它将解析所有 make 文件,甚至那些与当前顶级目标无关的文件,并且不要想要为不需要/不会使用的情况创建临时目录。

我很清楚过去在 SO 上提出了许多关于从单个输入创建多个文件的问题。一种解决方案是(非静态)模式规则;其他解决方案涉及虚假目标。但是,在这种情况下,我不知道如何将所有这些放在一起。

我可以使用静态模式规则识别更改并复制它们的文件

$(FILES): output/%.xhtml : input/%.xhtml
    TMPDIR=`mktemp -d`
    cp $< $(TMPDIR)

但实际上我更喜欢使用单个 cp 命令复制文件,而这会一一复制它们。也许这里有一些应用cp -u

我还考虑为那些需要更新的文件使用临时扩展,但也看不出如何让它工作。当所有文件发生变化时,我即将放弃并在所有文件上运行撒克逊变换,但有没有更好的方法?

4

3 回答 3

1

就个人而言,我不会尝试从命令行执行此操作。这部分是因为我不是一个 shell 脚本向导。我也不是 Ant 向导,但因为需要处理未更改的文件,所以这似乎非常属于 Ant 领域。另一方面,Ant 将为每个转换重新编译样式表,这是您可能希望避免的开销;如果是这种情况,那么您最好的选择可能是编写一个小的 Java 应用程序。它可能只有 100 行或更少。

最后一种可能性是在 Saxon 中进行处理:即使用 collection() 函数读取多个输入文件并使用 xsl:result-document 生成多个结果文件的单个转换。Saxon(商业版)提供最后修改的扩展功能,允许您过滤要处理的文件。对于 1000 个文件,您可能还需要扩展函数 saxon:discard-document() 来防止堆填充。

于 2013-02-22T09:18:19.153 回答
0

就个人而言,我喜欢你原来的每个文件一个编译器的公式。这不适合make的-j n标志吗?

您当然可以通过复制来批量处理文件,然后在最后运行 saxon。递归 make(啊!)可以整理排序。就像是:

.PHONY: all
all:
    rm -rf tmpdir
    ${MAKE} tmpdir/sentinel
    saxon -s:tmpdir -o:output foo.xslt

tmpdir/sentinel: $(FILES) ; touch $@

$(FILES): output/%.xhtml: input/%.xhtml
    ln $< $(patsubst input/%,tmpdir/%,$<)

这确实有效,尽管我对撒谎感到非常反感(静态模式规则声称在 中创建目标output/,但实际上在 中做了它的肮脏行为tmpdir/)。

请注意,在 的配方中tmpdir/sentinel,它$?已正确设置为过期的输出文件列表。如果您可以将一堆文件传递给 saxon 而不是文件夹,这可能会很有用。

于 2013-02-28T17:04:55.117 回答
0

我认为这里的一个问题是“saxon”支持目录中的一个文件或所有文件,因此不适合在不复制到临时目录的情况下进行批处理。

否则,使用时间戳标记文件作为代理目标非常简单。例如:

output/.timestamp : $(FILES)
    mkdir -p $(@D)
    $(COMMAND) -outputdir=output $?
    touch $@

这三个命令是:

  1. 确保输出目录存在。
  2. 对比时间戳文件新的文件运行批处理命令。
  3. 更新时间戳文件(必要时创建它)。

请记住,命令的每一行都在其自己的子 shell 中执行,并且如果任何命令行失败,则不会调用后续行。

这种方法对 Java 构建很有用。

于 2013-07-30T17:22:53.623 回答