我正在使用 webhdfs 将数据从本地文件系统摄取到 HDFS。现在我想确保摄取到 HDFS 中的文件的完整性。
如何确保传输的文件没有损坏/更改等?
我使用下面的 webhdfs 命令来获取文件的校验和
curl -i -L --negotiate -u: -X GET "http://$hostname:$port/webhdfs/v1/user/path?op=GETFILECHECKSUM"
我应该如何使用上述校验和来确保摄取文件的完整性?请建议
以下是我正在遵循的步骤
>md5sum locale_file
740c461879b484f4f5960aa4f67a145b
>hadoop fs -checksum locale_file
locale_file MD5-of-0MD5-of-512CRC32C 000002000000000000000000f4ec0c298cd6196ffdd8148ae536c9fe
本地系统上文件的校验和与 HDFS 上的相同文件不同我需要比较校验和我该怎么做?