我有一个列名 MyRoles,其中包含存储在名为 UserRoles 的字段中的项目(整数)列表。我想编写一个查询来检查特定项目是否在列表中。该列表将如下所示:“1,2,3”
我不能使用 WHERE MyRoles
查询应该是什么样子?
这与我的想法类似:
SELECT *
FROM MyTable
WHERE MyRoles CONTAINS ('1')
没有答案很容易实现并且会让我在一条丑陋的道路上走得更远,这一事实清楚地表明规范化数据库始终是最好的选择。
我有一个列名 MyRoles,其中包含存储在名为 UserRoles 的字段中的项目(整数)列表。我想编写一个查询来检查特定项目是否在列表中。该列表将如下所示:“1,2,3”
我不能使用 WHERE MyRoles
查询应该是什么样子?
这与我的想法类似:
SELECT *
FROM MyTable
WHERE MyRoles CONTAINS ('1')
没有答案很容易实现并且会让我在一条丑陋的道路上走得更远,这一事实清楚地表明规范化数据库始终是最好的选择。
您可以使用LIKE
:
SELECT *
FROM MyTable
WHERE MyRoles LIKE ('%1%')
这可能会执行得很糟糕(因为索引对于这样的搜索将毫无用处)。10
当然,即使1
查询中不存在,也会匹配。您可以扩展该方法:
SELECT *
FROM MyTable
WHERE MyRoles = '1'
OR MyRoles LIKE '1,%'
OR MyRoles LIKE '%,1,%'
更好的解决方案是规范化您的数据库并且没有多值字段。使用多对多表,每行包含单个角色 ID 和项目 ID。这更容易查询。
一些数据库会为这样的查询提供更好的工具,但这些将是扩展而不是标准 SQL - 你没有提到特定的 RDBMS。
如果您使用 LIKE,请注意:
如果 MyRoles 是,2,11
那么它会匹配,LIKE('%1%')
尽管您不希望它匹配。
一个痛苦的解决方法是使用
SELECT *
FROM MyTable
WHERE MyRoles LIKE ('%,1,%')
但是您需要在每个 MyRoles 条目中放置前导和尾随逗号。
这些各种丑陋的事实是每个人都告诉您更改数据库设计并创建“角色”表的原因。
SELECT *
FROM MyTable
WHERE FIND_IN_SET(1, MyRoles)
编辑: 它适用于 mysql 数据库服务器。
编辑:
find_in_set function
对于postgres:
create function find_in_set(n int, s text) returns bigint as
$$
select z.row_number
from
(
select row_number() over(), y.x
from (select unnest(('{' || $2 || '}')::int[]) as x) as y
) as z
where z.x = $1
$$ language sql;
将其转换为数组:
SELECT *
FROM MyTable
WHERE ('{' || MyRoles || '}')::int[] && array[1]
更好的是,您可以在上述混乱中使用索引。在构建数组时,将文本完全转换为数组类型将被拒绝,但您可以解决它:
create function role_scan(text) returns int[] as $$
select ('{' || $1 || '}')::int[];
$$ language sql immutable strict;
create index on MyTable using gin (role_scan(MyRoles));
-- actually use the index
SELECT *
FROM MyTable
WHERE role_scan(MyRoles) && array[1]
添加索引有一个警告,您应该注意这一点。stats 收集器不查看(最多 9.1)到实际的数组值。重叠算子的选择性(1/200,即非常有选择性)针对所有意图和目的进行了硬编码。因此,如果您正在查询非常常见的值,您可能会在不合适的地方进行索引扫描。一种解决方法是当您知道有很多角色适用时,直接调用底层重叠方法(提供 1/3 的选择性并且没有潜在的索引扫描):
SELECT *
FROM MyTable
WHERE arrayoverlap(role_scan(MyRoles), array[1])
也许正则表达式可以在这里提供帮助:
SELECT *
FROM MyTable
WHERE MyRoles ~ ('^(.*,)*' || 1 || '(,.*)*$')