我有许多包含如下数据的文本文件:
{'photo': {'people': {'haspeople': 0}, 'dateuploaded': '1264588417', 'originalformat': 'jpg', 'tags': {'tag': [{'machine_tag': 0 ,'作者':'14988396@N00','文本':'bokehlicious','raw':'Bokehlicious','作者名':'chachahavana','id':'1921934-4308203423-4944107'}],[ {'machine_tag':0,'author':'14988396@N00','text':'bokehlicious2','raw':'Bokehlicious2','authorname':'chachahavana','id':'1921934-4308203423- 4944107'}],'统计':'好的'}
这应该是 json 格式,但是有一些问题导致它像这样保存。
现在,我想从这些文件中提取特定的字符串。例如,我想要以下内容:文本 bokehlicious、bokehlicious2 等作为此文件的元胞数组。
我尝试使用 textscan,但这没有任何正确的格式等等,所以我想知道如何在文本文件中出现所有“文本”之后提取所有字符串。
你能就如何做到这一点提供任何意见吗?谢谢