0

我在单元格中有一些字符串名称。我想将其他单元格中的某个名称与它进行比较。

例如,第一个单元格的第一列与第二个单元格的所有列。

在以下示例中,单元格 a 和单元格 b。如您所见,第 3 列的许多元素与上述第 3 列的元素相匹配。我想逐列比较。

有什么办法不使用循环进行单元格比较?

 a=

'virutass'  'BrucePerens'   'RogerBrowne'   'keverets'
'armando'   'srivasta'      'riel'          'theo'
[]          'wichert'       'acme'          'rgb'
[]          'joey'          'aoliva'        'benc'
[]          'buffy'         'connolly'      'azz'
[]          'willow'        'itamar'        'dorward'
[]          'gnuchris'      'Kay'            'nuked'
[]          'edward'        'sab39'          'Yashy'
[]          'rcw'            'sad'           'idallen'
[]          'JHM'          'davem'            []
[]          'jgg'           'Blacky'          []



b=

 'sp'       'Erbo'         'connolly'     'draco'
'thomasd'   'miguel'       'joey'            []
'isenguard' 'mathieu'      'Kay'             []
'yole'      'fejj'         'acme'            []
'ewan'      'harinath'     'sad'             []

如果超过 60% 的元素在一列中,则结果为列号。在此示例中,a 的第 3 列是结果。因为 b 中的第 3 列与超过 %60 的元素匹配。

4

2 回答 2

1

你想逐列比较单元格(cell1column1 与 cell2column1,cell1column2 与 cell2colun2 .....)并检查至少 60% 的匹配?顺序是否重要(如果两列中的名称相同,但行不同,可以吗)?

if length(intersect(a(:,1),b(:,1)))>0.6*length(b(:,1))
disp('Column 1 is good')
else
disp('Column 1 is bad')
end
if length(intersect(a(:,2),b(:,2)))>0.6*length(b(:,2))
disp('Column 2 is good')
else
disp('Column 2 is bad')
end
if length(intersect(a(:,3),b(:,3)))>0.6*length(b(:,3))
disp('Column 3 is good')
else
disp('Column 3 is bad')
end
if length(intersect(a(:,4),b(:,4)))>0.6*length(b(:,4))
disp('Column 4 is good')
else
disp('Column 4 is bad')
end
于 2013-07-28T16:11:24.313 回答
1

使用匿名函数和带有ismember函数的cell/arrayfun可能有助于解决您的需求:

如果您真的不需要保留行和列:

% Remove empty cells to compare only strings
emptyCells = @(x) cellfun(@isempty,x);
a(emptyCells(a)) = [];
b(emptyCells(b)) = [];

% Get ids of element of b included in a
id = cellfun(@(elem) ismember(elem, a), b);

% Shows resutls
b(id)

如果您确实需要保持单元格行之间的比较:

nColumns = 4
emptyCells = @(x) cellfun(@isempty,x);
% get only the non-empty values of the cell
getValue = @(dataCell) dataCell(not(emptyCells(dataCell)));

% Compare for each columns, values of b(:,col) and a(:,col)
isBinA = arrayfun(@(col) ismember(getValue(b(:,col)), getValue(a(:,col))), 1:nColumns, 'UniformOutput', 0);

在这里,您将获得一个具有逻辑值的单元格,例如:

isBinA{3}

ans =

     1
     0
     1
     1
     1

在单元格 b 的第 3 列中,您有 4 个名称,它们包含在单元格 a 的第 3 列中:

b(isBinA{3},3)

ans = 

    'connolly'
    'Kay'
    'acme'
    'sad'
于 2013-07-28T16:07:03.690 回答