9

我有一个孟加拉语的 Excel 文件。要正确显示孟加拉语文本,我需要在 PC 上安装孟加拉语字体。

我使用 Office 2010 将 Excel 文件转换为 CSV。但它只显示“?” 标记而不是孟加拉语字符。然后我使用谷歌文档进行转换,同样的问题,但不可读的字符而不是'?'。我将该文件的摘录粘贴到一个 HTML 文件中,并试图在我的浏览器中查看它,但没有成功。

我应该怎么做才能从孟加拉语的 .xlsx 文件中获取 CSV 文件,以便将其导入 MySQL 数据库?

编辑:这个 SO question中接受的答案让我去 Google Docs。

4

1 回答 1

3

根据Excel to CSV with UTF8 encoding问题的答案,Google Docs 应该正确保存 CSV,这与 Excel 不同,Excel 会破坏正在使用的“ANSI”编码中无法表示的所有字符。但也许他们改变了这一点,或者出了什么问题,或者对情况的分析不正确。

对于在 MS Office 程序中处理的正确编码的孟加拉语(孟加拉语),应该不需要任何“孟加拉字体”,因为 Arial Unicode MS 字体(随 Office 提供)包含孟加拉字符。那么数据实际上是在一些依赖于特殊编码字体的非标准编码中吗?在这种情况下,应首先将其转换为 Unicode,尽管可能可以使用始终使用该特定字体的程序以某种方式对其进行管理。

在 Excel 中,当使用另存为时,您可以选择“Unicode 文本 (*.txt)”。它将数据保存为 UTF-16 编码的 TSV(制表符分隔值)。然后,您可能需要将其转换为使用逗号而不是制表符作为分隔符,和/或从 UTF-16 转换为 UTF-8。但这只有在原始数据被正确编码的情况下才有效。

于 2012-06-20T10:28:21.617 回答