我正在导入一个城市列表,并根据此列表中的值,执行进一步的操作。然而,这个列表是手动输入的,这使得它很容易出错。
我想知道是否有某种类型的打字错误识别(比如谷歌使用“你的意思是 x 吗?”)。
我尝试检查部分城市文本,但这会产生比它解决的更多的错误(因为城市的一部分也可能作为另一个城市的一部分出现)。
好消息是,我有一个记忆中正确城市的列表,所以也许它可以与一个模式匹配?
我的问题是:dotNet 中是否有处理这些问题的子框架框架?如果没有,有人可以指出我正确的方向吗?
以下是手动输入列表中唯一值的示例(标有 X 的字段不正确,应映射到正确的字段):
GDANSK
HELSINGBORG
HRADEC KRALOVE
HRADEC KRALOVE 7 x
HRADEC KRALOW x
HYLLYKALLIO
JARVSO
JERVSO x
KATOWICE
KOTKA
KRAKOW
KULJO
LOIMAA
LULEA
MINSK
MINSK CEZ x
MOLNDAL
NORRKOPING
NORROPING x
NYBORG
NYIERGYHAZA
NYIREGYHAZA x
OSLO
OSTRAVA
OULU
PILZEN x
PLZEN
POZNAN
PRAHA
PRESOV
PUNANE
RIGA
RISKOV x
RISSKOV
RODDING
SANDEFJOR x
SANDEFJORD
SARPSBORG
ST PETERSBURG