我想从英语或阿拉伯语字符串中清除特殊字符。例如,以下示例中的“–”是显示“?”的特殊字符 转换为 UTF-8 时。
文件名:1-Mechanical Drawings – Part 1
应该是1-Mechanical Drawings Part 1
.
السلطات العراقية تعلنé
应该是السلطات العراقية تعلن
,其中é
是特殊字符,应该从字符串中删除。
我想从英语或阿拉伯语字符串中清除特殊字符。例如,以下示例中的“–”是显示“?”的特殊字符 转换为 UTF-8 时。
文件名:1-Mechanical Drawings – Part 1
应该是1-Mechanical Drawings Part 1
.
السلطات العراقية تعلنé
应该是السلطات العراقية تعلن
,其中é
是特殊字符,应该从字符串中删除。
这在某种程度上是在重新发明轮子,但是您可以执行以下操作来获得您在问题中想要的输出:
def clean_file name
result = File.basename(name,".*")
result.gsub!(/[é–]\s?/,'')
result
end
将 [] 中的位替换为您认为不适合 é 等文件名的字符。但要注意两件事: