我正在努力将一小部分音乐从我的 iTunes 库导出到外部驱动器,以用于 Sonos 扬声器(通过 Sonos 上的媒体库)。一切都很顺利,直到我在曲目、专辑和艺术家姓名中发现了一些 unicode 文本。
我正在从 Mac 上的 iTunes 转移到 Linux (Ubuntu) 上的文件夹结构,并且文件路径都包含原始的 Unicode 名称,并且这些都在艺术家/专辑视图中的 Sonos 中显示和播放。唯一的问题是播放列表,我是通过一些 Python3 代码生成的。
Sonos 似乎不支持 .m3u / .m3u8 播放列表中的 UTF-8 编码。Sonos 将字符 ÷ 解释为 ÷,经过一番谷歌搜索后,我发现显然混淆了 UTF-8 和 UTF-16(UTF-8 中的 ÷ 0xC3 0xB7,而 UTF-16 中的 à 是 U+00C3 和· 在 UTF-16 中是 U+00B7)。我尝试了许多不同的编码方式,但无法让它识别名称中包含非标准(非 ASCII?)字符的曲目。
然后我尝试了 .wpl 播放列表,并认为我已经解决了。路径中带有 ÷ 和 • 等字符的曲目现在可以完美运行,只需在播放列表文件本身中使用 unicode / UTF-8 形式的这些字符。
然而,就在我开始整理和完成代码时,我发现了一些其他字符没有得到正确处理:ö、å、á 和其他几个字符。我已经尝试将它们用作它们的原始 unicode 字符,也用作它们的编码 XML 标识符,例如,́
使用这种格式不会影响什么工作或不工作 - ÷ ( ÷
) 和 • ( •
) 很好,而 ö ( ö
)、å ( å
) 和 á ( á
) 不是。
我以前从未真正使用过 unicode / UTF-8,但在阅读了各种指南和操作方法后,我觉得我已经接近了,但可能只是缺少一些简单的东西。一些 unicode 字符现在可以工作,而另一些则不能,这一事实让我认为这一定很明显!我猜不同之处在于重音会修改前一个字符,而不是本身就是一个字符,但尝试删除前一个字母并没有奏效!
在 Python 本身中,我并没有做任何特别聪明的事情。我使用以下方法从 iTunes 的 XML 文件中读取数据:
with open(settings['itunes_path'], 'rb') as itunes_handle:
itunes_library = plistlib.load(itunes_handle)
对于导出,我尝试了几十种不同的选项,但通常如下所示(有时使用 encoding='utf-8' 和各种其他选项):
with open(dest_path, 'w') as playlist_file:
playlist_file.write(generated_playlist)
generated_playlist
从 iTunes_library 中提取和过滤数据的结果在哪里,urllib.parse.unquote()
在任何 iTunes XML 数据上运行。
任何关于在哪里看的想法或提示将不胜感激!我希望对于更了解 Unicode 的人来说,答案真的很明显!谢谢!
当前版本的代码在这里可用:https ://github.com/dwalker-uk/iTunesToSonos