49

背景:我正在编写一个 python 程序来管理我的音乐文件。它爬取目录并将文件及其元数据(通过诱变剂)以 JSON 编码,作为简单的“数据库”放入文件中。我的目录搜索得很好,但是当我尝试保存数据库或编码为 JSON 时,它会抛出“TypeError: {...} is not JSON serializable”(... 是 dict 中的一些键和值,更多内容如下)

问题:程序按照以下格式构建一个大字典对象:

{
    "<song id>":{
        "artist":"<song artist>",
        "album":"<song album>",
        "title":"<song title>"},
    ...
}

每首歌曲文件都通过这种格式进行索引。当我尝试将数据库转储到文件时,我得到了这个:

Traceback (most recent call last):
  File "<pyshell#2>", line 1, in <module>
    sit()
  File "D:\workbench\ideas\musicmanager\v0\spider.py", line 116, in sit
    json.dump(js.db,f,True)
  File "C:\Python27\lib\json\__init__.py", line 181, in dump
    for chunk in iterable:
  File "C:\Python27\lib\json\encoder.py", line 428, in _iterencode
    for chunk in _iterencode_dict(o, _current_indent_level):
  File "C:\Python27\lib\json\encoder.py", line 402, in _iterencode_dict
    for chunk in chunks:
  File "C:\Python27\lib\json\encoder.py", line 402, in _iterencode_dict
    for chunk in chunks:
  File "C:\Python27\lib\json\encoder.py", line 436, in _iterencode
    o = _default(o)
  File "C:\Python27\lib\json\encoder.py", line 178, in default
    raise TypeError(repr(o) + " is not JSON serializable")
TypeError: {'album': [u"Rooney's Lost Album"], 'title': [u'The Kids
After Sunset'], 'artist': [u'Rooney']} is not JSON serializable

该特定歌曲条目的键是

Rooney|Rooney's Lost Album|The Kids After Sunset|The Kids After Sunset.itunes.mp3

(id 的格式有点大,我可能最终会散列...)

所以我试图

json.dumps({'album': [u"Rooney's Lost Album"], 'title': [u'The Kids
After Sunset'], 'artist': [u'Rooney']})

效果很好,就像

json.dumps({"Rooney|Rooney's Lost Album|The Kids After Sunset|The Kids
After Sunset.itunes.mp3":""})

然后我尝试了这个:

rooney = "Rooney|Rooney's Lost Album|The Kids After Sunset|The Kids
    After Sunset.itunes.mp3"
json.dumps({rooney:js.db['songsbyid'][rooney]})

再次因类型错误而失败。

为什么该对象会因 json.dump 而失败?我有很多其他对象,其键包含管道“|” 和撇号“'”......目前,我无法让其他任何人对此进行测试,我应该发布数据库对象的腌制版本吗?

补充笔记

  • json.dumps 下面的结果对象很好,所以我想知道这个问题是否与数据库的大小有任何关系?

    {rooney:js.db['songsbyid'][rooney]} {"Rooney|Rooney's Lost Album|The Kids After Sunset|The Kids After Sunset.itunes.mp3": {'album': [u"Rooney's Lost Album" ], 'title': [u'The Kids After Sunset'], 'artist': [u'Rooney']}}

  • 如果我通过重命名扩展名来排除歌曲以便脚本忽略它,另一首任意歌曲会导致相同的错误。我重命名&排除了这首新歌,又遇到了另一首新歌……我不知道有多少。

  • 我更改了我的程序以抓取包含原始问题歌曲的下一个最远的子目录,并且 json.dump 在完全不同的歌曲上引发了 TypeError ......

4

3 回答 3

60

因为它实际上不是字典;它是另一种看起来像字典的映射类型。用于type()验证。将其传递给以dict()从中获取真正的字典。

于 2012-06-03T17:57:07.980 回答
4

就我而言,我的 Python dict 中的布尔值是问题所在。JSON 布尔值是小写的(“true”、“false”),而在 Python 中它们是大写的(“True”、“False”)。在网上的任何地方都找不到此解决方案,但希望对您有所帮助。

于 2018-08-21T15:53:30.610 回答
2

我写了一个类来规范化字典中的数据。下面的 NormalizeData 类中的“元素”需要是 dict 类型。并且您需要在 __iterate() 中替换为您的自定义类对象或您想要规范化的任何其他对象类型。

class NormalizeData:

    def __init__(self, element):
        self.element = element

    def execute(self):
        if isinstance(self.element, dict):
            self.__iterate()
        else:
            return

    def __iterate(self):
        for key in self.element:
            if isinstance(self.element[key], <ClassName>):
                self.element[key] = str(self.element[key])

            node = NormalizeData(self.element[key])
            node.execute()
于 2014-02-06T16:00:07.040 回答