conda - conda build - 添加大量测试数据的推荐方法

Question

我正在为一个测试套件需要大量测试数据（~50MB）的软件开发一个 conda 包。conda 文档说明了如何使用配方中包含的测试数据。当测试数据很重时，我想最好动态下载它们而不是将数据包含在配方中，但是在 meta.yml 中声明它的最佳方法是什么？数据存档的下载和提取应该在 build.sh 还是其他地方完成？

score 2 · Accepted Answer

我建议将测试数据列为附加source下载。

大多数 conda 配方仅从单个源 tarball（或 git 存储库等）下载，但如果需要，配方允许列出多个源，所有源都已下载。这是一个简单的例子：

{% set name = "foo" %}
{% set version = "0.1" %}

package:
  name: {{ name|lower }}
  version: {{ version }}

source:
  # Main source code
  - url: http://example.com/yada/yada/foo-{{ version }}.tar.gz
    sha256: 90e64c6eca4be47bbf1d61f53dc003c6621213738d4ea7a35e5cf1ac2de9bab1

  # Also download test data into a folder named 'test-data'
  - url: http://example.com/yada/yada/my-test-data.tar.gz
    sha256: 3b9c5e0f09ca14a54454319b64af98a02d0ae1b3eb1122c95e2130736f440cd1
    folder: test-data

build:
  number: 0

requirements:
  # etc, etc, ...

test:
  source_files:
    - test-data
  commands:
    - run_my_tests --data-dir=test-data

笔记：

提供一个folder名称以指定应在work目录中解压缩附加源的位置。否则，它将在目录的根work目录下解压，就像第一个源一样。
该work目录在测试阶段开始之前被删除，因此您需要在该test:source_files:部分中列出您的测试数据目录，以确保将其复制到执行测试的文件夹中。

conda - conda build - 添加大量测试数据的推荐方法

1 回答 1

Related

Reference