神器版本:5.8.4
在 Artifactory 中,文件通过文件的校验和 (SHA1) 存储在内部数据库中,出于检索目的,SHA-256 很有用(用于验证文件是否完整)。
首先阅读:https ://www.jfrog.com/confluence/display/RTF/Checksum-Based+Storage
假设有 2 个 Jenkins 作业,它们创建的工件/文件(rpm/jar/etc)很少。就我而言,我将采用一个简单的 .txt 文件,它以 MM/DD/YYYY 格式存储日期和其他一些 jobA/B 特定的构建结果文件(jars/rpms 等)。
如果我们只关注文本文件(如上所述),那么:
Jenkins_jobA > 生成 jobA.date_mm_dd_yy.txt
Jenkins_jobA > 生成jobB.date_mm_dd_yy.txt
Jenkins jobA 和 jobB 每天运行多次,没有给定的运行顺序。有时jobA首先运行,有时jobB。
由于两个作业的文件内容基本相同(每天),jobA 的 .txt 文件和 jobB.txt 文件上的 SHA-1 值将相同,即在 Artifactory 中,两个文件都将存储在前 2 个字符中目录文件夹结构(根据基于校验和的存储机制)。
基本上在 Linux 的两个文件上运行 sha1sum 和 sha256sum 会返回完全相同的输出。
随着时间的推移,这些工件(.txt 等)从一个存储库提升到另一个存储库(提升过程,即从快照 -> 阶段 -> 发布存储库),所以我目前用 Groovy 编写的逻辑是找到位于后面的工件的URI下面列出了“虚拟”存储库(其中包含一组按某种顺序排列的物理本地存储库):
// Groovy code
import groovy.json.JsonSlurper
import groovy.json.JsonOutput
jsonSlurper = new JsonSlurper()
// The following function will take artifact.SHA_256 as it's parameter to find URI of the artifact
def checkSumBasedSearch(artifactSha) {
virt_repo = "jar-repo" // this virtual may have many physical repos release/stage/snapshot for jar(maven) or it can be a YUM repo for (rpm) or generic repo for (.txt file)
// Note: Virtual repos don't span different repo types (i.e. a virtual repository in Artifactory for "Maven" artifacts (jar/war/etc) can NOT see YUM/PyPi/Generic physical Repos).
// Run aqlCmd on Linux, requires "...", "..", "..." for every distinctive words / characters in the cmd line.
checkSum_URL = artifactoryURL + "/api/search/checksum?sha256="
aqlCmd = ["curl", "-u", username + ":" + password, "${checkSum_URL}" + artifactSha + "&repos=" + virt_repo]
}
def procedure = aqlCmd.execute()
def standardOut = new StringBuilder(), standardErr = new StringBuilder()
procedure.waitForProcessOutput(standardOut, standardErr)
// Fail early
if (! standardErr ) {
println "\n\n-- checkSumBasedSearch() - standardErr exists ---\n" + standardErr +"\n\n-- Exiting with error 12!!!\n\n"
System.exit(12)
}
def obj = jsonSlurper.parseText(standardOut.toString())
def results = obj.results
def uri = results[0].uri // This would work, if a file's sha-1 /256 is always different or sits in different repo at least.
return uri
// to get the URL, I can use:
//aqlCmd = ["curl", "-u", username + ":" + password, "${uri}"]
//def procedure = aqlCmd.execute()
//def obj = jsonSlurper.parseText(standardOut.toString())
//def url = obj.downloadUri
//return url
//aqlCmd = [ "curl", "-u", username + ":" + password, "${url}", "-o", somedirectory + "/" + variableContainingSomeArtifactFilenameThatIWant ]
//
// def procedure = aqlCmd.execute()
//def standardOut = new StringBuilder(), standardErr = new StringBuilder()
//procedure.waitForProcessOutput(standardOut, standardErr)
// Now, I'll get the artifact downloaded in some Directory as some Filename.
}
我担心的是,由于两个文件(即使名称不同-or file-<versioned-timestamp>.txt
)在其中具有相同的内容并且每天生成多次,我如何才能为 jobA 或 jobB 下载特定版本的文件?
在 Artifactory 中,包含相同内容的所有文件的 SHA_256 属性将相同!!(Artifactory 将使用 SHA-1 有效地存储这些文件以节省空间,新的上传将只是对用户透明的最小数据库级事务)。
问题:
上述逻辑是否会返回jobA的文件或jobB的.txt文件或任何Job的.txt文件,它首先上传它的文件或latest/acc。到 LastModified -aka- 最后上传时间?
如何为给定的时间戳下载 jobA 的 .txt 文件和 jobB 的 .txt 文件?
我需要在我的休息 Api 调用期间添加更多属性吗?
如果我只是关心文件内容,那么无论它来自 JobA .txt 还是来自作业的 .txt 文件都没有多大关系(取决于 sha-1/256),但在复杂的情况下,文件名可能包含他们想知道的有意义的信息,以找到下载的文件(A / B)!