3

我们最近在我们的构建环境中添加了第二台构建机器,并且开始遇到非常奇怪的偶尔构建失败。

我有两个单独的 Maven 构建机器AB,每个都运行 Maven 2.2.1 并与共享的 Nexus 1.5.0 存储库管理器通信。我的问题是,在B上构建偶尔会失败,因为它拒绝下载以前由A构建并上传到 Nexus的常见依赖项“ acme-1.0.0-SNAPSHOT ”的较新版本。

查看两台机器上的本地存储库,我注意到存储库元数据中有一些奇怪之处。

机器A的 acme\1.0.0-SNAPSHOT\maven-metadata-nexus.xml:

<metadata>
  <groupId>acme</groupId>
  <artifactId>acme</artifactId>
  <version>1.0.0-SNAPSHOT</version>
  <versioning>
    <snapshot>
      <buildNumber>1</buildNumber>
    </snapshot>
    <lastUpdated>20100525173546</lastUpdated>
  </versioning>
</metadata>

机器B的 acme\1.0.0-SNAPSHOT\maven-metadata-nexus.xml:

<metadata>
  <groupId>acme</groupId>
  <artifactId>acme</artifactId>
  <version>1.0.0-SNAPSHOT</version>
  <versioning>
    <snapshot>
      <buildNumber>2</buildNumber>
    </snapshot>
    <lastUpdated>20100519232317</lastUpdated>
  </versioning>
</metadata>

在 Nexus 的 acme/1.0.0-SNAPSHOT/maven-metadata.xml 中:

<metadata>
  <groupId>acme</groupId>
  <artifactId>acme</artifactId>
  <version>1.0.0-SNAPSHOT</version>
  <versioning />
</metadata>

如果我正确解释元数据文件(在线文档很少),机器B似乎认为它具有更新版本的acme依赖项(基于 buildNumber),尽管机器A上次构建它是在机器B 6 天后完成的(基于时间戳)。Nexus 似乎也不知道普遍正确的 buildNumber。

这种情况怎么可能出现?我可以做些什么来防止我的构建由于元数据不一致而失败?你有过类似的经历吗?

重要笔记:

  • 两台构建机器都有 settings.xml 文件,其中 updatePolicy 是“始终”。
  • Nexus 确实具有由A构建的更新版本的acmeB只是拒绝下载它。
  • AB是唯一上传到 Nexus 的机器。
  • 两台服务器共享相同的系统时间。
  • 所有涉及的进程都具有对元数据文件的写入权限,以便可以根据需要对其进行更新。
  • 我找不到任何描述此行为的开放 Maven 或 Nexus 问题。
  • 我们的 CI 服务器 (Atlassian Bamboo) 防止构建相同的工件同时发生,因此在上传到 Nexus 时出现一些竞争条件是不太可能的。
4

2 回答 2

2

看起来您从 Nexus 发布了错误的 maven-metadata,这看起来像是 acme 文件夹中的那个,而不是 acme/1.0-SNAPSHOT 文件夹中的那个。(它会有内部版本号和时间戳)。

无论如何,您是否尝试过将 -U 添加到 Maven 构建命令中?您可能偶然发现了一些关于始终设置的 Maven 错误,但我确信 -U 有效。

于 2010-06-06T01:54:40.917 回答
2

我花了一段时间,但我找到了 maven bug MNG-4142的潜在问题。

这是发生的事情:

我的acme-1.0-SNAPSHOT (build 1) 安装在A上并上传到 Nexus。该项目接下来在B上构建,其中安装了新构建的acme-1.0-SNAPSHOT(构建 2)并上传到 Nexus,覆盖构建 1。

然后,当在具有acme-1.0-SNAPSHOT作为依赖项的A机器上发生构建时,MNG-4142 启动。存储库元数据包含“true”,这阻止A下载acme-1.0-SNAPSHOT的最新构建 2 ,因此 maven 针对导致构建失败的旧版本 1 构建了我的项目。即使使用了 -U,情况仍然如此。

正如我在这个问题上所提到的,我对这种行为感到非常惊讶,并且很难想到其他分布式构建环境在存在这个错误的情况下是如何工作的。我们目前有一些 cron 作业经常将“localCopy”元数据更改为 false,以便获得我认为应该是默认且正确的行为。

于 2010-06-07T15:47:58.890 回答