4

我有一张表,其记录代表某些对象。为简单起见,我将假设该表只有一列,这是唯一的ObjectId. 现在我需要一种方法来存储该表中的对象组合。组合必须是唯一的,但可以是任意长度。例如,如果我有ObjectIds

1,2,3,4

我想存储以下组合:

{1,2}, {1,3,4}, {2,4}, {1,2,3,4}

订购不是必需的。我当前的实现是有一个将 sCombinations映射ObjectIdCombinationIds 的表。所以每个组合都会收到一个唯一的 ID:

ObjectId | CombinationId
------------------------
1        | 1
2        | 1
1        | 2
3        | 2
4        | 2

这是上面示例的前两种组合的映射。问题是,查找CombinationId特定组合的查询似乎非常复杂。该表的两个主要使用场景是遍历所有组合,并检索特定组合。该表将被创建一次并且永远不会被更新。我通过 JDBC使用SQLite 。有没有更简单的方法或最佳实践来实现这样的映射?

4

3 回答 3

2

问题是,查找特定组合的 CombinationId 的查询似乎非常复杂。

应该不会太差。如果您想要包含所选项目的所有组合(允许附加项目),它就像:

SELECT combinationID
FROM Combination
WHERE objectId IN (1, 3, 4)
GROUP BY combinationID
HAVING COUNT(*) = 3 -- The number of items in the combination

如果您只需要特定组合(不允许额外的项目),它可以更像:

SELECT combinationID FROM (
   -- ... query from above goes here, this gives us all with those 3
) AS candidates

-- This bit gives us a row for each item in the candidates, including 
-- the items we know about but also any 'extras'
INNER JOIN combination ON (candidates.combinationID = combination.combinationID)

GROUP BY candidates.combinationID
HAVING COUNT(*) = 3 -- Because we joined back on ALL, ones with extras will have > 3

您也可以在此处(或在原始查询中)使用 NOT EXISTS,这似乎更容易解释。

最后,您也可能会喜欢并拥有一个简单的查询

SELECT combinationID
FROM Combination AS candidates
INNER JOIN Combination AS allItems ON 
  (candidates.combinationID = allItems.combinationID)
WHERE candidates.objectId IN (1, 3, 4)
GROUP BY combinationID
HAVING COUNT(*) = 9 -- The number of items in the combination, squared

所以换句话说,如果我们正在寻找 {1, 2},并且有一个与 {1, 2, 3} 的组合,我们将有一个 {candidates, allItems}JOIN结果:

{1, 1}, {1, 2}, {1, 3}, {2, 1}, {2, 2}, {2, 3}

额外的 3在 ingCOUNT(*)之后是 6 行GROUP,而不是 4 行,所以我们知道这不是我们想要的组合。

于 2010-05-19T12:56:51.877 回答
1

这可能是异端,但对于您的使用场景,使用非规范化结构可能会更好,您将组合本身存储为某种复合(文本)值:

CombinationId | Combination
---------------------------
1             | |1|2|
2             | |1|3|4|

如果您制定规则,在生成复合值时始终对 ObjectId 进行排序,则很容易检索给定对象集的组合。

于 2010-05-19T11:48:05.047 回答
0

另一种选择是使用关系值属性,在 SQL DBMS 中称为多重集或嵌套表。

如果除了集合本身之外没有对象集合的标识符,则关系值属性可能是有意义的。但是,我认为任何 SQL DBMS 都不允许在该类型的列上声明键,因此如果您没有可以使用的替代键,这可能会成为问题。

http://download.oracle.com/docs/cd/B10500_01/appdev.920/a96594/adobjbas.htm#458790

于 2010-05-19T12:16:06.540 回答