我正在开发一个包含许多小型 PDF 文件的 LateX 包( http://www.openlilylib.org/lilyglyphs )。目前只有几十个,但随着软件包及其用户群的增长,可能会有数百个(但不太可能超过 1000 个)。
PDF 通常只有几 KB 大小,但我不知道是否在 Git 存储库中跟踪它们。这些文件随时可能更改,但可能不会太频繁。
通常有人被告知不要跟踪无法区分的二进制文件,但我也读到这对于较小的文件和较小的总体积并不重要。我认为最终 PDF 的总和不会超过几 MB。
该软件包将可作为下载或通过我更喜欢的 Git 存储库提供,因为使用该软件包很自然地会导致贡献......
目前,当克隆 Git 存储库时,必须使用 Python 和 LilyPond 符号软件重建 pdf,所以风险相当高 - 这就是为什么我想将 pdf 直接放在 repo 中。
有什么想法吗?
编辑以回应答案/评论:
pdf 文件是从存储库中的源生成的,这就是我不愿意在 Git 中跟踪它们的原因。
但:
- pdfs 是使用软件包所必需的,因此用户需要拥有它们
- 要生成 pdf,需要 Python 和 LilyPond,并且它们都不是使用包所必需的。所以我觉得要求某人安装两个程序只是为了安装我的包是一个太大的负担。
我没有看到需要决定克隆 Git 存储库的人来运行安装脚本的问题,但是软件依赖性可能太高了? - 目前生成 pdf 在合理的时间内完成,因为只有几十个。但是随着文件数量的增加,这一次可能会变得不可接受。
pdf 文件在更新/更正时会发生变化。这不会经常发生,我认为这可以通过跟踪源代码来解决。但是,只要有新版本的 LilyPond 可用,pdf 也会发生变化,可能每两到四个星期。因此,虽然来源保持不变,但 pdf 会定期更改 - 这是一个明确的指标,反对使用 Git 跟踪它们。
另一方面,我们正在谈论(可能)几百个文件,每个文件只有几 KB,所以我不知道是否值得为这个问题烦恼。