问题标签 [git-annex]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
git-annex - 有没有办法只下载datalad数据集的一部分?
例如:
datalad install -g ///adhd200/RawData/Brown 下载整个数据集。
但可以说我只想要:
原始数据 / 棕色 / 0026001 / session_1 / anat_1
有没有办法做到这一点?
git - 列出 git repo 中未由 `git Annex add` 添加的所有文件
有没有办法列出我通过git add
(ref 1) 而不是git annex add
(ref 2) 添加的所有文件?
所以当我运行git <some command>
它应该显示类似
我使用的解决方案之一是https://stackoverflow.com/a/61680771/7274758。但我想知道是否有更好的方法?
git - NFS 共享上的相对符号链接
我在我的 Linux 服务器上设置了一个 NFS 共享,这一行位于/etc/exports
:
但是,此共享主要包含 git 存储库,或者更具体地说,是git-annexes。也就是说,存储库主要包含指向.git/annex
目录内某个位置的相对符号链接。现在,这可以在 Linux 机器上正常访问,但在 Windows 上,符号链接根本不显示(使用官方 NFS 客户端)。如果我导航到该.git/annex
文件夹,文件仍然存在,只是缺少符号链接。
有什么方法可以配置 Windows 以实际查看符号链接,还是根本不可能(还)?
(另外,我知道它git-annex
可以在“直接”模式下运行,没有符号链接,但如果可能的话,我想避免这种情况。)
git - 将 datalad 与 Google Cloud Storage 结合使用
我是 Datalad 的新手。我正在尝试为每个对我的 Datalad 数据集进行任何更改的人获取版本历史记录和提交详细信息。
到目前为止,我能够将本地数据集的同级创建到云存储桶,并能够将 Datalad 数据集导出到 GCS 存储桶/Datalad 同级。
我在这里想要实现的是以下几点: -
- 在某些文件被更改到我的 Datalad 目录的地方,提交应该能够捕获用户详细信息。
目前,它捕获了我在 git 安装期间设置的我的 git config 详细信息。有没有办法在提交时使用 Datalad 动态传递这些值?
- 我不希望我的本地磁盘维护文件的历史记录,只是元数据,我想将它存储在 GCS 存储桶上的版本历史记录。
目前,我可以使用 git-annex export 命令将所有文件/文件夹(包含历史记录的 .git 文件夹除外)推送到 GCS 兄弟。有没有办法将版本历史推送到 GCS 存储桶并从那里获得洞察力,而不是在本地存储所有内容?
- 此外,我使用的大多数命令都是 git-annex 命令。是否存在用于相同操作的 Datalad API?
任何见解都会有所帮助。
git - 与 Unix 组共享 git-annex 存储库
我想为给定组的所有用户创建一个可通过 ssh 读写的存储库。
在stackoverflow 上快速搜索导致我执行以下过程:
我的问题很简单:将它应用到 git-annex 存储库是否也安全?还有,够吗?
git - Git 合并说“以下未跟踪的工作树文件将被合并覆盖”但列出的文件被跟踪
我没有看到在 中列为未跟踪的文件git status
,甚至尝试修改一个,但它确实显示为已修改git status
,因此文件被跟踪。为什么git merge
说他们没有被追踪?
如果这很重要,这是一个 git-annex 存储库。
git - 如何永久删除 git 中的提交(附件)?
我已经开始在我的实验室中使用 datalad(git 附件的包装器)来控制版本控制数据和过期时间。它工作得很好,除了 .git 文件夹可以默默地变大,特别是在 git 历史中来回重复某些步骤时。例如,有时我做了一个提交,意识到我需要修复一些东西,所以回滚它,git reset HEAD~
然后从那里进行额外的提交。这会孤立以前是 HEAD 的提交,因此它不会出现在其中,git log
但其所有关联文件仍将在附件中,如果您有提交 sha,您仍然可以使用git show
它。如何永久删除这些孤立的提交,以使它们及其关联文件不占用磁盘空间?我试过git gc --prune=now --aggressive
了,但这似乎什么也没做。
例如:
python - 如何在 Django 中表示一类现有的 python api?
我正在尝试将现有的 python API(它不是 Web API,它是一个名为Datalad的 python 库)集成到 Django 应用程序中。
更深入地说,我想创建一个代表数据集类的 django 模型,即 git/git-annex 存储库的表示。
django 模型类应该镜像数据集类的属性和方法,并最终扩展它们。
我的目的是创建一个 django 应用程序来创建和管理 git/git-annex 存储库,该存储库将成为序列化为 json(添加到 git 树)或二进制文件(由 git-annex 管理)的通用对象的存储后端。
例如,我将拥有代表视频、音频、超文本等内容的 django 模型和代表存储库的模型。
当我添加视频时,我会将视频本身添加到选择的 git-annex 存储库中,并将其元数据序列化并作为 json 文件提交到 git 中。
最好的方法是什么?
git - MacOS 11.2.3 上的非确定性“git fsck”错误的原因,即使在删除和重新克隆之后?
我的个人笔记本电脑上有几个 git 和git-annex存储库,它运行带有 git 版本 2.24.3(Apple Git-128)和 git-annex 8.20210310 的 MacOS 11.2.3。
将我的笔记本电脑升级到 11.2.x (Big Sur) 后,我开始注意到在磁盘上运行存储库时出现了更高级别的错误git fsck
,即使没有明确的原因导致此类错误发生。为了解决这个问题,我已经从遥控器中删除并重新克隆了许多存储库,以试图消除这些错误。
最近,我git fsck
在一个 git-annex 存储库中发现了我之前删除并重新克隆的错误(尽管我也合并了来自另一个远程的提交)。我还在这个 repo 中观察到了莫名其妙的非确定性行为git fsck
,其中多次重新运行命令会产生不同的结果,如下所示:
在这里,git fsck
完成一次检测到问题,完成一次未检测到问题,然后由于两个不同对象上的读取错误而失败两次。
这表明根本原因可能是某些文件系统或磁盘损坏,但反对这一点的一个信号是,在升级到 Big Sur 后开始出现错误,并且对于大多数存储库来说,删除和重新克隆都被压缩了。在遇到这些错误以检查磁盘损坏后,我以前也运行过 MacOS 磁盘实用程序,但没有检测到任何问题 - 但是这是不久前的事情,我正在重新运行以确认。
其他人是否遇到过这些问题——通常是git fsck
升级到 MacOS 11.2.x 后的错误率更高,或者特别是在git fsck
. 这些错误的根本原因是什么?
编辑:torek 在下面的评论导致我发现了这个 SuperUser question,这表明这样的错误可能与防病毒有关。我目前正在运行 BitDefender,但在其“屏蔽”功能关闭时遇到了这些问题。过去,我也曾在我的笔记本电脑上安装过 Avast 和 Avira,但在我的笔记本电脑上已经卸载了几个月。