8
map1 = containers.Map({'212','2','12','44'},[4,5,6,7]);
keyset = str2double(keys(map1));

现在我对键集进行了一组操作,这些操作将返回

Keyset= [203,2,12,39];

我厌倦了以下内容:

num2cell(num2str(keyset));
num2cell(num2str(keyset,1));
num2cell(num2str(keyset,'%11.0g'));
num2cell(num2str(keyset,3));

以上所有在最终的单元格数组中给出了奇怪的结果。我只需要将整数用作另一个容器映射的键。

4

4 回答 4

13

我提出了 5 个额外的解决方案,其中三个比目前提出的解决方案快 4-5 倍。从中吸取的教训是:

  • num2str是缓慢的
  • cellfun并且arrayfun会增加大量开销
  • 有多种方法可以将数值数组转换为字符串元胞数组。

三个最高性能的解决方案在性能方面非常相似:

循环分配单元格元素

n4 = length(Keyset);
tmp4 = cell(n4,1);
for i4 = 1:n4
    tmp4{i4} = sprintf('%i',Keyset(i4));
end

将所有转换为字符串并调用textscan

tmp6 = textscan(sprintf('%i\n',Keyset'),'%s');
tmp6 = tmp6{1};

将所有转换为字符串并调用regexp.

tmp3 = regexp(sprintf('%i ',Keyset),'(\d+)','match');

这是带有时间的完整测试代码:

function t = speedTest

t=zeros(7,1);
for ii=1:100, 
    Keyset=randi(1,10,100); % random keys
    tic; 
    eval( [ 'tmp1 = { ', sprintf(' %d ', Keyset), ' }; '] );
    t(1)=t(1)+toc; 
    tic;
    tmp2=arrayfun(@num2str, Keyset, 'Uniform', false);
    t(2)=t(2)+toc;

    tic;
    tmp3 = regexp(sprintf('%i ',Keyset),'(\d+)','match');
    t(3) = t(3)+toc;

    tic;
    n4 = length(Keyset);
    tmp4 = cell(n4,1);
    for i4 = 1:n4
        tmp4{i4} = sprintf('%i',Keyset(i4));
    end
    t(4) = t(4)+toc;

    tic;
    n5 = length(Keyset);
    tmp5 = cell(n5,1);
    for i5 = 1:n5
        tmp4{i5} = num2str(Keyset(i5));
    end
    t(5) = t(5)+toc;

    tic;
    tmp6 = textscan(sprintf('%i\n',Keyset'),'%s');
    tmp6 = tmp6{1};
    t(6) = t(6)+toc;

    tic;
    tmp7 = num2cell(Keyset);
    tmp7 = cellfun(@(x)sprintf('%i',x),tmp7,'uni',false);
    t(7) = t(7)+toc;


end;
t

t =

    1.7820
   21.7201
    0.4068
    0.3188
    2.2695
    0.3488
    5.9186
于 2012-12-31T00:13:04.453 回答
7

怎么样:

arrayfun(@num2str, Keyset, 'Uniform', false)'

这应该为您的示例产生一个 4×1 单元格数组:

ans = 
    '203'
    '2'
    '12'
    '39'
于 2012-12-30T12:06:49.617 回答
3

怎么样:

eval( [ 'NewKeySetStr = { ', sprintf(' %d ', Keyset), ' }; '] );
NewKeySetStr

我不确定这是实现预期结果的最优雅的方式,但它似乎工作......

将运行时与 Eitan 的解决方案进行比较:

t=zeros(2,1);
for ii=1:100, 
    Keyset=randi(1,10,100); % random keys
    tic; 
    eval( [ 'NewKeySetStr = { ', sprintf(' %d ', Keyset), ' }; '] );
    t(1)=t(1)+toc; 
    tic;
    tmp=arrayfun(@num2str, Keyset, 'Uniform', false);
    t(2)=t(2)+toc;
end;
t

产量:

t =
   0.3986
   2.2527

似乎提议的解决方案更快。

注意:似乎当前的实现cellfun没有针对速度进行优化。据传,在未来的版本中,Mathworks 打算引入更好的cellfun. 因此,Eitan 的解决方案在当前版本中可能不是最优的,但它似乎是 Matlab 技能的一个很好的实践。

于 2012-12-30T11:53:56.997 回答
0

想出了如何使用拆分功能改进大整数的正则表达式解决方案。此外,我被 Jonas 的一个解决方案误导了,该解决方案没有评估 for 循环中的所有 sprintf 调用。编辑:还添加了评论中建议的新 2016 字符串功能。

t = speedTest()

function t = speedTest

t=zeros(5,1);
for ii=1:100
    Keyset=randi(10000000,10,1000); % random keys

    tic;
    n4 = numel(Keyset); % changed to numel (length only gives number of columns)
    tmp1 = cell(n4,1);
    for i4 = 1:n4
        tmp1{i4} = sprintf('%i',Keyset(i4));
    end
    t(1) = t(1)+toc;

    tic;
    tmp2 = regexp(sprintf('%i ',Keyset),'(\d+)','match');
    t(2) = t(2)+toc;

    tic;
    tmp3 = regexp(sprintf('%i ',Keyset),' ','split');
    tmp3(end) = [];
    t(3) = t(3)+toc;

    tic;
    tmp4 = string(Keyset(:));
    t(4) = t(4)+toc;

    # test in case you want to go back to characters
    tic;
    tmp5 = char(string(Keyset(:)));
    t(5) = t(5)+toc;
end
end

带有 split 的 regexp 解决方案会产生更好的性能,而 string 方法甚至更快:

t =

    6.1916
    1.1292
    0.8962
    0.6671
    0.7523
于 2017-11-30T12:42:36.790 回答