我有一个包含错误数据的文件(一些随机的 SUB 控制字符本身......它们不是字素的一部分),我试图使用正则表达式搜索模式删除它们:
Text to Find: \x1a
Replace with:
这会删除我的 SUB 字符,但它也会弄乱我的其他带有重音符号的字符(特别是 é 和 í)。
是否有一个正则表达式可以单独删除 SUB 控制字符(代码点)?(例如不是字素的一部分)
SAMPLE DATA(用 SUB 控制字符替换您看到的任何地方“␚”:
A,André,Fernandez
A,Daniel,O␚Shea
A,Ibhlín,Flanders
A,Donny,O␚'Donnell
A,Spencer,O'Maley
如果我使用当前的正则表达式,则输出样本数据:
A,Andr�,Fernandez
A,Daniel,OShea
A,Ibhl�n,Flanders
A,Donny,O'Donnell
A,Spencer,O'Maley
所需的数据输出
A,André,Fernandez
A,Daniel,OShea
A,Ibhlín,Flanders
A,Donny,O'Donnell
A,Spencer,O'Maley