我正在寻找一个将生成“字母数字哈希”的函数。给定一个源字符串,它会生成一个确定的结果字符串,该字符串可以包含任何字母 az 或数字 0-9,并且不能通过逆向工程来生成源。这将用于为基于机密数据的系统生成密码,因此 8 到 12 个字符之间的字符串是理想的,安全哈希也是理想的。
我在想我可以使用普通的按位哈希,将其异或折叠为 64 位(例如,如果我使用 SHA256),然后一次取 5 位结果(产生一个数字 0-31)并查找索引有序集合中使用的字符代码。有 26 个字母和 10 位数字,这意味着我必须省略一些(可能会删除如果手写可能会被误认为其他字符的字符)。64 位,一次 5 位,将产生一个 12 字符的字符串,剩下 4 位。
但是,我担心两件事:首先,通过采用非 2 的位数来引入偏差;其次,如何处理剩余的位。我是按原样使用它们,知道只有 16 种可能性,我是不使用它们(并丢失可能引入偏差的数据),还是我再合并一个位来制作一个 13 个字符的字符串(最后一位应该在哪里?来自)?
编辑:这是我目前的尝试;它需要一个可枚举的字节(就像大多数哈希算法产生的字节数组一样)并返回一个字符串:
/// <summary>
/// Converts an IEnumerable of bytes to a string representation which can have any lowercase letter a-z except for l, o, q and z, and any digit 0-9.
/// Uses 5 bits of the byte array at a time to generate numbers from 0 to 31, which are then translated to letters or numbers.
/// </summary>
/// <param name="toConvert">the byte array to convert.</param>
/// <returns>A string containing the alphanumeric case-insensitive representation of the bytes in the array.</returns>
public static string ToInsensitiveAlphaNumericString(this IEnumerable<byte> toConvert)
{
var chars = new[]
{
'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'm', 'n', 'p', 'r', 's', 't',
'u', 'v', 'w', 'x', 'y', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9'
};
var enumerator = toConvert.GetEnumerator();
enumerator.MoveNext();
int buffer = enumerator.Current;
short bufferLength = 8;
const int valueLength = 5;
var builder = new StringBuilder();
while (true)
{
var value = buffer >> (bufferLength - valueLength);
builder.Append(chars[value]);
buffer = buffer - (value << (bufferLength - valueLength));
bufferLength -= valueLength;
if(bufferLength < valueLength )
{
if (enumerator.MoveNext())
{
buffer = (buffer << 8) + enumerator.Current;
bufferLength += 8;
}
else
{
//here's the main question; to include, or not to include?
if (bufferLength > 0)
builder.Append(chars[buffer]);
break;
}
}
}
return builder.ToString();
}