我正在寻找一种方法来确定最“不同”或“可识别”的 N 个 ASCII 字符...例如,如果 N = 10,从 0x21 到 0x7E 的 ASCII 集中最不同的 N 个字符是什么?显然,字符“X”与“O”(字母)非常不同,但“O”(字母)与“0”(零)非常相似。假设一个受限制的 OCR 字符子集,这样零和字母 O 将被检测为一个或另一个,并且不必担心它是零还是字母 O,那么最不同的 N 是什么典型的 OCR 引擎(例如 Tesseract)容易从质量差的输入图像中识别出的字符?假设。例如“+”和“t”可能会被广泛地误认为是彼此。可以制作,
谢谢,本