3

我们的旧 sql 遗留代码之一,使用 HASHBYTES 函数和 sha2_256 转换 sql 中的数字列。

整个过程正在转向 python,因为我们在遗留工作的基础上进行了一些高级用法。但是,当使用连接器时,我们调用的是相同的 sql 代码,HASHBYTES('sha2_256',column_name) id 返回值很多垃圾。

在sql中运行代码会导致这个

Column      Encoded_Column
101286297   0x7AC82B2779116F40A8CEA0D85BE4AA02AF7F813B5383BAC60D5E71B7BDB9F705

从 python 运行相同的 sql 查询会导致

Column      Encoded_Column
101286297 

b"z\xc8+'y\x11o@\xa8\xce\xa0\xd8[\xe4\xaa\x02\xaf\x7f\x81;S\x83\xba\xc6\r^q\xb7\xbd\xb9\ xf7\x05"

代码是

Select Column,HASHBYTES('SHA2_256', CONVERT(VARBINARY(8),Column)) as Encoded_Column from table

我尝试过通常的垃圾清除但没有帮助

4

1 回答 1

5

你得到了正确的结果,但显示为原始字节(这就是你有 b in 的原因b"...")。

查看SQL的结果,您有使用hexadecimal编码的数据。

因此,要转换 python 结果,您可以执行以下操作:

x = b"z\xc8+'y\x11o@\xa8\xce\xa0\xd8[\xe4\xaa\x02\xaf\x7f\x81;S\x83\xba\xc6\r^q\xb7\xbd\xb9\xf7\x05"

x.hex().upper()

结果将是:

'7AC82B2779116F40A8CEA0D85BE4AA02AF7F813B5383BAC60D5E71B7BDB9F705'

这就是您在 SQL 中所拥有的。

您可以在此处阅读有关Python 代码中不存在的SQL0x结果开头的更多信息。

最后,如果您正在使用 pandas,您可以使用以下命令转换整个列:

df["Encoded_Column"] = df["Encoded_Column"].apply(lambda x: x.hex().upper())

# And if you want the '0x' at the start do:
df["Encoded_Column"] = "0x" + df["Encoded_Column"]
于 2020-01-24T08:21:54.680 回答