1

我正在处理从 MAC OS - File Maker Pro 程序导出的 CSV 文件。CSV 似乎格式正确。它可以导入 PHP 和我的 MySQL 数据库。它还使用 LibreOffice Calc 导入到我的 Ubuntu 操作系统中。但是,在所有情况下,我都会得到奇怪的字符。它应该是 UTF-8 字符集,但我不确定。谁能帮助解释正在发生什么样的转变?

例子:

...先驱印刷品。,[1880 年代?]。第一版也是唯一一版...

....这个制造商参与的优秀遗物......

编辑:

看上面的一部分:

[1880’s?]

manufacturer’s

lost.




od -ctx1 part.txt

0000000   [   1   8   8   0 342 200 231   s   ?   ]  \r   m   a   n   u

         5b  31  38  38  30  e2  80  99  73  3f  5d  0d  6d  61  6e  75

0000020   f   a   c   t   u   r   e   r 342 200 231   s  \r   l   o   s

         66  61  63  74  75  72  65  72  e2  80  99  73  0d  6c  6f  73

0000040   t   .      \v  \r  \r

         74  2e  20  0b  0d  0d

0000046
4

1 回答 1

0

编码确实是 UTF8,你的引号就在那里:

http://www.tachyonsoft.com/uc0020.htm

您看到的转换似乎是 UTF8 解释为 ISO-8859-1[5] 或 Latin1,在您阅读后,请检查您的 MySQL 是否使用 UTF8 作为字符集,并且提取阶段是否将其保留为 UTF8(例如,如果您将数据发送到宣传 ISO-8859-15 的网页,您会看到这一点——欧元符号后面跟着垃圾)。

于 2012-08-22T15:35:10.447 回答