string - 使用matlab将特定表达式后的单词存储在文本文件中

Question

我有许多包含如下数据的文本文件：

{'photo': {'people': {'haspeople': 0}, 'dateuploaded': '1264588417', 'originalformat': 'jpg', 'tags': {'tag': [{'machine_tag': 0 ，'作者'：'14988396@N00'，'文本'：'bokehlicious'，'raw'：'Bokehlicious'，'作者名'：'chachahavana'，'id'：'1921934-4308203423-4944107'}]，[ {'machine_tag'：0，'author'：'14988396@N00'，'text'：'bokehlicious2'，'raw'：'Bokehlicious2'，'authorname'：'chachahavana'，'id'：'1921934-4308203423- 4944107'}]，'统计'：'好的'}

这应该是 json 格式，但是有一些问题导致它像这样保存。

现在，我想从这些文件中提取特定的字符串。例如，我想要以下内容：文本 bokehlicious、bokehlicious2 等作为此文件的元胞数组。

我尝试使用 textscan，但这没有任何正确的格式等等，所以我想知道如何在文本文件中出现所有“文本”之后提取所有字符串。

你能就如何做到这一点提供任何意见吗？谢谢

score 0 · Accepted Answer

尝试使用正则表达式提取它。

fid = fopen('...yourpath\textFile.txt','r');
str = fread(fid,inf,'uint8=>char')';
str = strrep(str,'''','');
textStr = regexp(str,'(?<=text:\s*)\w*','match');

例如，如果您想要使用 'id' regexp(str,'(?<=id:\s*)\w*','match');代替

string - 使用matlab将特定表达式后的单词存储在文本文件中

1 回答 1

Related

Reference