可能重复:
使用 UTF8 编码的 Excel 到 CSV
场景:我有一个包含大量全球客户数据的 excel 文件。我不知道创建文件时使用了什么编码。
问题:如何确定 excel 文件中使用的字符编码,以便将其正确导入到另一个软件中?
可能重复:
使用 UTF8 编码的 Excel 到 CSV
场景:我有一个包含大量全球客户数据的 excel 文件。我不知道创建文件时使用了什么编码。
问题:如何确定 excel 文件中使用的字符编码,以便将其正确导入到另一个软件中?
对于 Excel 2010,它应该是 UTF-8。MS 指导: http:
//msdn.microsoft.com/en-us/library/bb507946:
“SpreadsheetML 文档的基本文档结构由 Sheets 和 Sheet 元素组成,它们引用工作簿中的工作表。为每个工作表创建一个单独的 XML 文件。例如,具有两个工作表名称 MySheet1 和MySheet2 位于 Workbook.xml 文件中,如下代码示例所示。
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
<workbook xmlns=http://schemas.openxmlformats.org/spreadsheetml/2006/main xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships">
<sheets>
<sheet name="MySheet1" sheetId="1" r:id="rId1" />
<sheet name="MySheet2" sheetId="2" r:id="rId2" />
</sheets>
</workbook>
工作表 XML 文件包含一个或多个块级元素,例如 SheetData。sheetData 表示单元格表并包含一个或多个 Row 元素。一行包含一个或多个 Cell 元素。每个单元格都包含一个代表单元格值的 CellValue 元素。例如,工作簿中第一个工作表的 SpreadsheetML(在单元格 A1 中只有值 100)位于 Sheet1.xml 文件中,如下面的代码示例所示。
<?xml version="1.0" encoding="UTF-8" ?>
<worksheet xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main">
<sheetData>
<row r="1">
<c r="A1">
<v>100</v>
</c>
</row>
</sheetData>
</worksheet>
"
检测细胞编码: