sql - 我什么时候应该使用 CROSS APPLY 而不是 INNER JOIN？

Question

使用CROSS APPLY的主要目的是什么？

我已经阅读（模糊地，通过 Internet 上的帖子），cross apply如果您正在分区，则在选择大型数据集时可能会更有效。（想到分页）

我也知道CROSS APPLY不需要 UDF 作为右表。

在大多数INNER JOIN查询（一对多关系）中，我可以将它们重写为 use CROSS APPLY，但它们总是给我等效的执行计划。

谁能给我一个很好的例子，说明什么时候CROSS APPLY在那些INNER JOIN也能起作用的情况下有所作为？

编辑：

这是一个简单的示例，其中执行计划完全相同。（告诉我它们的不同之处以及cross apply更快/更高效的地方）

create table Company (
    companyId int identity(1,1)
,   companyName varchar(100)
,   zipcode varchar(10) 
,   constraint PK_Company primary key (companyId)
)
GO

create table Person (
    personId int identity(1,1)
,   personName varchar(100)
,   companyId int
,   constraint FK_Person_CompanyId foreign key (companyId) references dbo.Company(companyId)
,   constraint PK_Person primary key (personId)
)
GO

insert Company
select 'ABC Company', '19808' union
select 'XYZ Company', '08534' union
select '123 Company', '10016'


insert Person
select 'Alan', 1 union
select 'Bobby', 1 union
select 'Chris', 1 union
select 'Xavier', 2 union
select 'Yoshi', 2 union
select 'Zambrano', 2 union
select 'Player 1', 3 union
select 'Player 2', 3 union
select 'Player 3', 3 


/* using CROSS APPLY */
select *
from Person p
cross apply (
    select *
    from Company c
    where p.companyid = c.companyId
) Czip

/* the equivalent query using INNER JOIN */
select *
from Person p
inner join Company c on p.companyid = c.companyId

score 759 · Accepted Answer

谁能给我一个很好的例子，说明何时 CROSS APPLY 在 INNER JOIN 也可以工作的情况下有所作为？

详细性能对比见我博客中的文章：

INNER JOIN对比CROSS APPLY

CROSS APPLY在没有简单JOIN条件的事情上效果更好。

此选项从以下每条记录中选择3最后一条记录：t2t1

SELECT  t1.*, t2o.*
FROM    t1
CROSS APPLY
        (
        SELECT  TOP 3 *
        FROM    t2
        WHERE   t2.t1_id = t1.id
        ORDER BY
                t2.rank DESC
        ) t2o

它不能很容易地用一个INNER JOIN条件来制定。

您可能可以使用CTE's 和 window 函数执行类似的操作：

WITH    t2o AS
        (
        SELECT  t2.*, ROW_NUMBER() OVER (PARTITION BY t1_id ORDER BY rank) AS rn
        FROM    t2
        )
SELECT  t1.*, t2o.*
FROM    t1
INNER JOIN
        t2o
ON      t2o.t1_id = t1.id
        AND t2o.rn <= 3

，但这不太可读，可能效率较低。

更新：

刚检查。

master20,000,000是带有PRIMARY KEYon的 about 记录表id。

这个查询：

WITH    q AS
        (
        SELECT  *, ROW_NUMBER() OVER (ORDER BY id) AS rn
        FROM    master
        ),
        t AS 
        (
        SELECT  1 AS id
        UNION ALL
        SELECT  2
        )
SELECT  *
FROM    t
JOIN    q
ON      q.rn <= t.id

运行几乎30几秒钟，而这个：

WITH    t AS 
        (
        SELECT  1 AS id
        UNION ALL
        SELECT  2
        )
SELECT  *
FROM    t
CROSS APPLY
        (
        SELECT  TOP (t.id) m.*
        FROM    master m
        ORDER BY
                id
        ) q

是瞬间的。

score 249 · Accepted Answer

考虑你有两张桌子。

主桌

x------x--------------------x
| Id   |        Name        |
x------x--------------------x
|  1   |          A         |
|  2   |          B         |
|  3   |          C         |
x------x--------------------x

详细信息表

x------x--------------------x-------x
| Id   |      PERIOD        |   QTY |
x------x--------------------x-------x
|  1   |   2014-01-13       |   10  |
|  1   |   2014-01-11       |   15  |
|  1   |   2014-01-12       |   20  |
|  2   |   2014-01-06       |   30  |
|  2   |   2014-01-08       |   40  |
x------x--------------------x-------x

有很多情况我们需要替换INNER JOIN为CROSS APPLY.

1. 根据TOP n结果连接两个表

考虑我们是否需要为每个from选择Id和Namefrom以及最后两个日期。MasterIdDetails table

SELECT M.ID,M.NAME,D.PERIOD,D.QTY
FROM MASTER M
INNER JOIN
(
    SELECT TOP 2 ID, PERIOD,QTY 
    FROM DETAILS D      
    ORDER BY CAST(PERIOD AS DATE)DESC
)D
ON M.ID=D.ID

SQL 小提琴

上述查询生成以下结果。

x------x---------x--------------x-------x
|  Id  |   Name  |   PERIOD     |  QTY  |
x------x---------x--------------x-------x
|   1  |   A     | 2014-01-13   |  10   |
|   1  |   A     | 2014-01-12   |  20   |
x------x---------x--------------x-------x

看，它为最后两个日期生成了最后两个日期的结果Id，然后只在外部查询中加入这些记录Id，这是错误的。这应该返回Ids1 和 2 但它只返回 1 因为 1 有最后两个日期。为此，我们需要使用CROSS APPLY.

SELECT M.ID,M.NAME,D.PERIOD,D.QTY
FROM MASTER M
CROSS APPLY
(
    SELECT TOP 2 ID, PERIOD,QTY 
    FROM DETAILS D  
    WHERE M.ID=D.ID
    ORDER BY CAST(PERIOD AS DATE)DESC
)D

SQL 小提琴

并形成以下结果。

x------x---------x--------------x-------x
|  Id  |   Name  |   PERIOD     |  QTY  |
x------x---------x--------------x-------x
|   1  |   A     | 2014-01-13   |  10   |
|   1  |   A     | 2014-01-12   |  20   |
|   2  |   B     | 2014-01-08   |  40   |
|   2  |   B     | 2014-01-06   |  30   |
x------x---------x--------------x-------x

这是它的工作原理。里面的查询CROSS APPLY可以引用外部表，而INNER JOIN不能这样做（它会引发编译错误）。查找最后两个日期时，在CROSS APPLYie内部完成加入WHERE M.ID=D.ID。

2. 当我们需要INNER JOIN使用函数的功能时。

CROSS APPLYINNER JOIN当我们需要从Mastertable 和 a中获取结果时，可以用作替换function。

SELECT M.ID,M.NAME,C.PERIOD,C.QTY
FROM MASTER M
CROSS APPLY dbo.FnGetQty(M.ID) C

这是功能

CREATE FUNCTION FnGetQty 
(   
    @Id INT 
)
RETURNS TABLE 
AS
RETURN 
(
    SELECT ID,PERIOD,QTY 
    FROM DETAILS
    WHERE ID=@Id
)

SQL 小提琴

这产生了以下结果

x------x---------x--------------x-------x
|  Id  |   Name  |   PERIOD     |  QTY  |
x------x---------x--------------x-------x
|   1  |   A     | 2014-01-13   |  10   |
|   1  |   A     | 2014-01-11   |  15   |
|   1  |   A     | 2014-01-12   |  20   |
|   2  |   B     | 2014-01-06   |  30   |
|   2  |   B     | 2014-01-08   |  40   |
x------x---------x--------------x-------x

交叉申请的额外优势

APPLY可以用作的替代品UNPIVOT。要么要么CROSS APPLY可以OUTER APPLY在这里使用，它们是可以互换的。

考虑你有下表（命名MYTABLE）。

x------x-------------x--------------x
|  Id  |   FROMDATE  |   TODATE     |
x------x-------------x--------------x
|   1  |  2014-01-11 | 2014-01-13   | 
|   1  |  2014-02-23 | 2014-02-27   | 
|   2  |  2014-05-06 | 2014-05-30   | 
|   3  |     NULL    |    NULL      |
x------x-------------x--------------x

查询如下。

SELECT DISTINCT ID,DATES
FROM MYTABLE 
CROSS APPLY(VALUES (FROMDATE),(TODATE))
COLUMNNAMES(DATES)

SQL 小提琴

这给你带来了结果

  x------x-------------x
  | Id   |    DATES    |
  x------x-------------x
  |  1   |  2014-01-11 |
  |  1   |  2014-01-13 |
  |  1   |  2014-02-23 |
  |  1   |  2014-02-27 |
  |  2   |  2014-05-06 |
  |  2   |  2014-05-30 | 
  |  3   |    NULL     | 
  x------x-------------x

score 214 · Accepted Answer

cross apply有时可以让你做一些你不能做的事情inner join。

示例（语法错误）：

select F.* from sys.objects O  
inner join dbo.myTableFun(O.name) F   
on F.schema_id= O.schema_id

这是一个语法错误，因为与一起使用时inner join，表函数只能将变量或常量作为参数。（即，表函数参数不能依赖于另一个表的列。）

然而：

select F.* from sys.objects O  
cross apply ( select * from dbo.myTableFun(O.name) ) F  
where F.schema_id= O.schema_id

这是合法的。

编辑： 或者，更短的语法：（由 ErikE）

select F.* from sys.objects O  
cross apply dbo.myTableFun(O.name) F
where F.schema_id= O.schema_id

编辑：

注意：Informix 12.10 xC2+ 具有横向派生表，而 Postgresql (9.3+) 具有横向子查询，可用于类似效果。

score 44 · Accepted Answer

在我看来，CROSS APPLY 在处理复杂/嵌套查询中的计算字段时可以填补一定的空白，并使它们更简单、更具可读性。

简单示例：您有一个 DoB，并且您希望呈现多个与年龄相关的字段，这些字段也将依赖于其他数据源（例如就业），例如 Age、AgeGroup、AgeAtHiring、MinimumRetirementDate 等，以便在您的最终用户应用程序中使用（例如 Excel 数据透视表）。

选项有限且很少优雅：

JOIN 子查询不能基于父查询中的数据在数据集中引入新值（它必须独立存在）。
UDF 很简洁，但速度很慢，因为它们往往会阻止并行操作。作为一个独立的实体可能是一件好事（更少的代码）或一件坏事（代码在哪里）。
连接表。有时它们可以工作，但很快你就会加入带有大量 UNION 的子查询。大混乱。
创建另一个单一用途视图，假设您的计算不需要在主查询中途获得的数据。
中间表。是的...这通常有效，并且通常是一个不错的选择，因为它们可以被索引并且速度很快，但是由于 UPDATE 语句不是并行的并且不允许级联公式（重用结果）来更新多个字段，性能也会下降同样的声明。有时你更喜欢一次性完成。
嵌套查询。是的，在任何时候，您都可以在整个查询上加上括号，并将其用作子查询，您可以在该子查询上操作源数据和计算字段等。但是你只能在它变得丑陋之前做到这一点。非常难看。
重复代码。3 个长 (CASE...ELSE...END) 语句的最大值是多少？这将是可读的！
- 告诉您的客户自己计算该死的东西。

我错过了什么？可能，所以请随时发表评论。但是，嘿，CROSS APPLY 在这种情况下就像天赐之物：您只需添加一个简单的CROSS APPLY (select tbl.value + 1 as someFormula) as crossTbl，瞧！您的新字段现在几乎可以使用，就像它一直存在于您的源数据中一样。

通过 CROSS APPLY 引入的值可以...

用于创建一个或多个计算字段，而不会增加性能、复杂性或可读性问题
与 JOIN 一样，随后的几个 CROSS APPLY 语句可以引用自己：CROSS APPLY (select crossTbl.someFormula + 1 as someMoreFormula) as crossTbl2
您可以在后续的 JOIN 条件中使用 CROSS APPLY 引入的值
作为奖励，还有表值函数方面

天啊，没有什么是他们做不到的！

score 22 · Accepted Answer

这已经在技术上得到了很好的回答，但是让我举一个具体的例子来说明它是如何非常有用的：

假设您有两个表，客户和订单。客户有很多订单。

我想创建一个视图，为我提供有关客户的详细信息以及他们最近下的订单。仅使用 JOINS，这将需要一些不漂亮的自连接和聚合。但是使用 Cross Apply，它超级简单：

SELECT *
FROM Customer
CROSS APPLY (
  SELECT TOP 1 *
  FROM Order
  WHERE Order.CustomerId = Customer.CustomerId
  ORDER BY OrderDate DESC
) T

score 14 · Accepted Answer

交叉应用也适用于 XML 字段。如果您希望结合其他字段选择节点值。

例如，如果您有一个包含一些 xml 的表

<root>
    <subnode1>
       <some_node value="1" />
       <some_node value="2" />
       <some_node value="3" />
       <some_node value="4" />
    </subnode1>
</root>

使用查询

SELECT
       id as [xt_id]
      ,xmlfield.value('(/root/@attribute)[1]', 'varchar(50)') root_attribute_value
  ,node_attribute_value = [some_node].value('@value', 'int')
  ,lt.lt_name   
FROM dbo.table_with_xml xt
CROSS APPLY xmlfield.nodes('/root/subnode1/some_node') as g ([some_node])
LEFT OUTER JOIN dbo.lookup_table lt
ON [some_node].value('@value', 'int') = lt.lt_id

将返回结果

xt_id root_attribute_value node_attribute_value lt_name
----------------------------------------------------------------------
1     test1            1                    Benefits
1     test1            4                    FINRPTCOMPANY

score 10 · Accepted Answer

交叉应用可用于替换需要子查询列的子查询

子查询

select * from person p where
p.companyId in(select c.companyId from company c where c.companyname like '%yyy%')

在这里我将无法选择公司表的列，因此，使用交叉应用

select P.*,T.CompanyName
from Person p
cross apply (
    select *
    from Company C
    where p.companyid = c.companyId and c.CompanyName like '%yyy%'
) T

score 7 · Accepted Answer

这是一个简短的教程，可以保存在一个.sql文件中并在我为自己编写的 SSMS 中执行，以快速刷新我对如何CROSS APPLY工作以及何时使用它的记忆：

-- Here's the key to understanding CROSS APPLY: despite the totally different name, think of it as being like an advanced 'basic join'.
-- A 'basic join' gives the Cartesian product of the rows in the tables on both sides of the join: all rows on the left joined with all rows on the right.
-- The formal name of this join in SQL is a CROSS JOIN.  You now start to understand why they named the operator CROSS APPLY.

-- Given the following (very) simple tables and data:
CREATE TABLE #TempStrings ([SomeString] [nvarchar](10) NOT NULL);
CREATE TABLE #TempNumbers ([SomeNumber] [int] NOT NULL);
CREATE TABLE #TempNumbers2 ([SomeNumber] [int] NOT NULL);
INSERT INTO #TempStrings VALUES ('111'); INSERT INTO #TempStrings VALUES ('222');
INSERT INTO #TempNumbers VALUES (111); INSERT INTO #TempNumbers VALUES (222);
INSERT INTO #TempNumbers2 VALUES (111); INSERT INTO #TempNumbers2 VALUES (222); INSERT INTO #TempNumbers2 VALUES (222);

-- Basic join is like CROSS APPLY; 2 rows on each side gives us an output of 4 rows, but 2 rows on the left and 0 on the right gives us an output of 0 rows:
SELECT
    st.SomeString, nbr.SomeNumber
FROM -- Basic join ('CROSS JOIN')
    #TempStrings st, #TempNumbers nbr
    -- Note: this also works:
    --#TempStrings st CROSS JOIN #TempNumbers nbr

-- Basic join can be used to achieve the functionality of INNER JOIN by first generating all row combinations and then whittling them down with a WHERE clause:
SELECT
    st.SomeString, nbr.SomeNumber
FROM -- Basic join ('CROSS JOIN')
    #TempStrings st, #TempNumbers nbr
WHERE
    st.SomeString = nbr.SomeNumber

-- However, for increased readability, the SQL standard introduced the INNER JOIN ... ON syntax for increased clarity; it brings the columns that two tables are
-- being joined on next to the JOIN clause, rather than having them later on in the WHERE clause.  When multiple tables are being joined together, this makes it
-- much easier to read which columns are being joined on which tables; but make no mistake, the following syntax is *semantically identical* to the above syntax:
SELECT
    st.SomeString, nbr.SomeNumber
FROM -- Inner join
    #TempStrings st INNER JOIN #TempNumbers nbr ON st.SomeString = nbr.SomeNumber

-- Because CROSS APPLY is generally used with a subquery, the subquery's WHERE clause will appear next to the join clause (CROSS APPLY), much like the aforementioned
-- 'ON' keyword appears next to the INNER JOIN clause.  In this sense, then, CROSS APPLY combined with a subquery that has a WHERE clause is like an INNER JOIN with
-- an ON keyword, but more powerful because it can be used with subqueries (or table-valued functions, where said WHERE clause can be hidden inside the function).
SELECT
    st.SomeString, nbr.SomeNumber
FROM
    #TempStrings st CROSS APPLY (SELECT * FROM #TempNumbers tempNbr WHERE st.SomeString = tempNbr.SomeNumber) nbr

-- CROSS APPLY joins in the same way as a CROSS JOIN, but what is joined can be a subquery or table-valued function.  You'll still get 0 rows of output if
-- there are 0 rows on either side, and in this sense it's like an INNER JOIN:
SELECT
    st.SomeString, nbr.SomeNumber
FROM
    #TempStrings st CROSS APPLY (SELECT * FROM #TempNumbers tempNbr WHERE 1 = 2) nbr

-- OUTER APPLY is like CROSS APPLY, except that if one side of the join has 0 rows, you'll get the values of the side that has rows, with NULL values for
-- the other side's columns.  In this sense it's like a FULL OUTER JOIN:
SELECT
    st.SomeString, nbr.SomeNumber
FROM
    #TempStrings st OUTER APPLY (SELECT * FROM #TempNumbers tempNbr WHERE 1 = 2) nbr

-- One thing CROSS APPLY makes it easy to do is to use a subquery where you would usually have to use GROUP BY with aggregate functions in the SELECT list.
-- In the following example, we can get an aggregate of string values from a second table based on matching one of its columns with a value from the first
-- table - something that would have had to be done in the ON clause of the LEFT JOIN - but because we're now using a subquery thanks to CROSS APPLY, we
-- don't need to worry about GROUP BY in the main query and so we don't have to put all the SELECT values inside an aggregate function like MIN().
SELECT
    st.SomeString, nbr.SomeNumbers
FROM
    #TempStrings st CROSS APPLY (SELECT SomeNumbers = STRING_AGG(tempNbr.SomeNumber, ', ') FROM #TempNumbers2 tempNbr WHERE st.SomeString = tempNbr.SomeNumber) nbr
-- ^ First the subquery is whittled down with the WHERE clause, then the aggregate function is applied with no GROUP BY clause; this means all rows are
--   grouped into one, and the aggregate function aggregates them all, in this case building a comma-delimited string containing their values.

DROP TABLE #TempStrings;
DROP TABLE #TempNumbers;
DROP TABLE #TempNumbers2;

score 5 · Accepted Answer

我想它应该是可读性的；）

CROSS APPLY 对于阅读的人来说有些独特，告诉他们正在使用 UDF，该 UDF 将应用于左侧表格中的每一行。

当然，CROSS APPLY 比上面其他朋友发布的 JOIN 更好地使用还有其他限制。

score 4 · Accepted Answer

这是一篇解释这一切的文章，以及它们在 JOINS 上的性能差异和用法。

SQL Server CROSS APPLY 和 OUTER APPLY over JOINS

正如本文所建议的，它们对于普通连接操作（INNER 和 CROSS）没有性能差异。

当您必须执行这样的查询时，使用差异就会出现：

CREATE FUNCTION dbo.fn_GetAllEmployeeOfADepartment(@DeptID AS INT)  
RETURNS TABLE 
AS 
RETURN 
   ( 
   SELECT * FROM Employee E 
   WHERE E.DepartmentID = @DeptID 
   ) 
GO 

SELECT * FROM Department D 
CROSS APPLY dbo.fn_GetAllEmployeeOfADepartment(D.DepartmentID)

也就是说，当您必须与功能相关时。这不能使用 INNER JOIN 完成，这会给您错误“无法绑定多部分标识符“D.DepartmentID”。” 在这里，值在读取每一行时传递给函数。对我来说听起来很酷。:)

score 4 · Accepted Answer

APPLY 运算符的本质是允许在 FROM 子句中运算符的左侧和右侧进行关联。

与 JOIN 相比，不允许输入之间的相关性。

谈到 APPLY 运算符中的相关性，我的意思是我们可以在右侧放置：

派生表 - 作为具有别名的相关子查询
表值函数 - 带有参数的概念视图，其中参数可以引用左侧

两者都可以返回多列和多行。

score 3 · Accepted Answer

好吧，我不确定这是否有资格作为使用 Cross Apply 与 Inner Join 的理由，但是在论坛帖子中使用 Cross Apply 为我回答了这个查询，所以我不确定是否有使用 Inner Join 的等价方法：

Create PROCEDURE [dbo].[Message_FindHighestMatches]

-- Declare the Topical Neighborhood
@TopicalNeighborhood nchar(255)

开始

-- SET NOCOUNT ON added to prevent extra result sets from
-- interfering with SELECT statements.
SET NOCOUNT ON

Create table  #temp
(
    MessageID         int,
    Subjects          nchar(255),
    SubjectsCount    int
)

Insert into #temp Select MessageID, Subjects, SubjectsCount From Message

Select Top 20 MessageID, Subjects, SubjectsCount,
    (t.cnt * 100)/t3.inputvalues as MatchPercentage

From #temp 

cross apply (select count(*) as cnt from dbo.Split(Subjects,',') as t1
             join dbo.Split(@TopicalNeighborhood,',') as t2
             on t1.value = t2.value) as t
cross apply (select count(*) as inputValues from dbo.Split(@TopicalNeighborhood,',')) as t3

Order By MatchPercentage desc

drop table #temp

结尾

score 2 · Accepted Answer

这可能是一个老问题，但我仍然喜欢 CROSS APPLY 的强大功能，它可以简化逻辑的重用并为结果提供“链接”机制。

我在下面提供了一个 SQL Fiddle，它显示了一个简单的示例，说明如何使用 CROSS APPLY 对数据集执行复杂的逻辑操作，而不会让事情变得一团糟。从这里不难推断出更复杂的计算。

http://sqlfiddle.com/#!3/23862/2

score 2 · Accepted Answer

虽然大多数使用 CROSS APPLY 的查询可以使用 INNER JOIN 重写，但 CROSS APPLY 可以产生更好的执行计划和更好的性能，因为它可以在连接发生之前限制正在连接的集合。

从这里偷来的

score 0 · Accepted Answer

我们使用CROSS APPLY来使用来自另一个（更新请求）表的JSON更新一个表——因为我们使用 OPENJSON 来读取 JSON 的内容，所以连接对此不起作用，而 OPENJSON 是一个“表值函数”。

我打算在这里放一个我们的 UPDATE 命令的简化版本作为示例，但是，即使是简化的，它也相当大且过于复杂。因此，仅对部分命令进行如此简化的“草图”就足够了：

SELECT  
       r.UserRequestId,
       j.xxxx AS xxxx,
FROM  RequestTable as r WITH (NOLOCK)
   CROSS APPLY
      OPENJSON(r.JSON, '$.requesttype.recordtype')
      WITH(
             r.userrequestid nvarchar(50) '$.userrequestid',
             j.xxx nvarchar(20) '$.xxx
           )j
       WHERE r.Id > @MaxRequestId
          and ... etc. ....

sql - 我什么时候应该使用 CROSS APPLY 而不是 INNER JOIN？

15 回答 15

Related

Reference