我想使用 CSV 文件中的数据,但我意识到字母显示不正确。我尝试了数百万种方法来转换编码,但没有任何效果。在 MacOS、PHP 7.4.4 上工作。
在执行fgets()或fgetcsv()处理变量之后,我会得到这个(例如 2 行/行)。
Kód ADM;Kód obce;Název obce;Kód MOMC;Název MOMC;Kód MOP;Název MOP;Kód èásti obce;Název èásti obce;Kód ulice;Název ulice;Typ SO;Èíslo domovní;Èíslo orientaèní;Znak èísla orientaèního;PSÈ;Souøadnice Y;Souøadnice X;Platí Od
1234;1234;HorniDolni;;;;;1234;HorniDolni;;;è.p.;2;;;748790401;4799.98;15893971.21;2013-12-01T00:00:00
它或多或少是正确的捷克语,但字母č被取代è和ř被取代ø,它们都不是捷克字母的一部分。我有信心,文件中会出现更多错位的字母。
执行file -I path/to/file我收到file: text/plain; charset=iso-8859-1这很可悲,因为就wiki而言,这个字符集不包含捷克字母。
以下命令都没有转换错位的字母:
mb_convert_encoding($line, 'UTF-8', 'ISO8859-1')
iconv('ISO-8859-1', 'UTF-8', $line)
iconv('ISO8859-1', 'UTF-8', $line)
我注意到在ISO-8859-1中这ø封信有一个代码00F8。Windows-1250(包括捷克语 aplhabet)具有正确的字母ř和代码0159 ,但它们都以00F8. 与 letter 相同,č并且è都以 code开头00E7。我不太了解编码,但似乎文件是在 Windows-1250 中编码的,但解释器认为编码是 ISO-8859-1 并采用原位的字母/代码。
但是这两种转换(ISO-8859-1 => Windows-1250、ISO-8859-1 => UTF-8 或其他方式)都不起作用。
有谁知道如何解决这个问题?谢谢!