在我们的一个应用程序中,用户可以将纯文本文件上传到系统中,然后读取和处理这些文件。不幸的是,用户对这些文件有多种编码(Ansi、UTF-*、Unicode 等),但最终我们需要将内容作为 UTF-8 字符串。
有没有办法获取任何输入字符串(编码方式),识别其编码并使用.Net标准功能转换为UTF-8?
在我们的一个应用程序中,用户可以将纯文本文件上传到系统中,然后读取和处理这些文件。不幸的是,用户对这些文件有多种编码(Ansi、UTF-*、Unicode 等),但最终我们需要将内容作为 UTF-8 字符串。
有没有办法获取任何输入字符串(编码方式),识别其编码并使用.Net标准功能转换为UTF-8?
Please, have a read at the following article : http://www.joelonsoftware.com/articles/Unicode.html
tl;dr; version : It does not make sense to have a string without knowing what encoding it uses.