7

有问题的 Sql Server 2008 R2 实例是一个重负载 OLTP 生产服务器。几天前出现了僵局问题,但仍未解决。我们收到了 Xml 死锁报告,其中列出了死锁中涉及的存储过程和一些其他细节。我将首先尝试列出此 xml 中的事实:

死锁涉及两个存储过程,例如 SP1 和 SP2。根据报告,SP1 运行在隔离级别“Serializable”SP2 运行在“ReadCommitted”

我们调查了以下内容:

  • 我们是在 SP 中还是在代码中将 SP1 的 IsolationLevel 设置为“Serializable”?- 不。

  • 是否有其他 IsolationLevel 为“Serializable”的 SP 调用 SP1?- 不。

  • SP1 使用的表是否被隔离级别为“可序列化”的任何其他 SP 调用?- 是的。有些 SP 的隔离级别设置为“可序列化”并访问与 SP1 相同的表,但我们不知道它们是否在死锁时运行,因为死锁
    报告仅显示 SP1 和 SP2。

思路:
我们考虑了以下可能的原因:

  • 发生死锁是因为 SP1 以“可序列化”方式运行。- 为什么我没有设置这个SP 在Serializable 中运行?隔离级别是否在升级(就像锁一样)?如果我们解决这个问题并让它以 ReadCommitted 的方式运行,问题会得到解决吗?

  • 任何其他 SP 正在运行,锁定 SP1 使用的表并导致 SP1 和 SP2 之间的死锁。- 这个SP不会在死锁报告中列出吗?死锁报告能错过这样的依赖吗?如果是,那么我们可能只会获得部分信息。不过,这仍然不能解决 SP1 在 Serializable 中的运行方式。

建议:

  • 如果这些信息不足以解决问题,我如何从 SQL Server 获取更多信息以用于我的目的以及我应该尝试收集哪些信息?

  • 您在解决此问题时会采取任何其他思路吗?

更新:
这是死锁的跟踪日志信息。我已经更改了 SP 等的名称,但已检查并确认更改不会遗漏任何相关信息。检查代码后面的注释以获取有关表格等的更多信息。

?<EVENT_INSTANCE>
  <EventType>DEADLOCK_GRAPH</EventType>
  <PostTime>2010-09-07T11:27:47.870</PostTime>
  <SPID>16</SPID>
  <TextData>
    <deadlock-list>
      <deadlock victim="process5827708">
        <process-list>
          <process id="process5827708" taskpriority="0" logused="0" waitresource="KEY: 7:72057594228441088 (8d008a861f4f)"
                   waittime="5190" ownerId="1661518243" transactionname="SELECT" lasttranstarted="2010-09-07T11:27:42.657"
                   XDES="0x80bf3b50" lockMode="RangeS-S" schedulerid="4" kpid="2228" status="suspended" spid="76" sbid="0"
                   ecid="0" priority="0" trancount="0" lastbatchstarted="2010-09-07T11:27:42.657"
                   lastbatchcompleted="2010-09-07T11:27:42.657" clientapp=".Net SqlClient Data Provider"
                   hostname="xxx" hostpid="5988" loginname="xxx" isolationlevel="serializable (4)"
                   xactid="1661518243" currentdb="7" lockTimeout="4294967295" clientoption1="673185824" clientoption2="128056">
            <executionStack>
              <frame procname="SP1" line="12" stmtstart="450" stmtend="6536"
                     sqlhandle="0x0300070090cbdc7742720c00e99d00000100000000000000">
                Select ... from Table1, Table2, Table4, Table5
              </frame>
            </executionStack>
            <inputbuf>
              Proc [Database Id = 7 Object Id = 2010958736]
            </inputbuf>
          </process>
          <process id="process5844bc8" taskpriority="0" logused="1873648" waitresource="KEY: 7:72057594228441088 (0e00ce038ed0)"
                   waittime="4514" ownerId="1661509575" transactionname="user_transaction" lasttranstarted="2010-09-07T11:27:40.423"
                   XDES="0x37979ae90" lockMode="X" schedulerid="7" kpid="3260" status="suspended" spid="104" sbid="0" ecid="0"
                   priority="0" trancount="2" lastbatchstarted="2010-09-07T11:27:43.350" lastbatchcompleted="2010-09-07T11:27:43.350"
                   clientapp=".Net SqlClient Data Provider" hostname="xxx" hostpid="5988" loginname="xxx"
                   isolationlevel="read committed (2)" xactid="1661509575" currentdb="7" lockTimeout="4294967295"
                   clientoption1="673185824" clientoption2="128056">
            <executionStack>
              <frame procname="SP2" line="68" stmtstart="5272" stmtend="5598"
                     sqlhandle="0x030007003432350f109a0c00e99d00000100000000000000">
                UPDATE Table1 ...
              </frame>
            </executionStack>
            <inputbuf>
              Proc [Database Id = 7 Object Id = 255144500]
            </inputbuf>
          </process>
        </process-list>
        <resource-list>
          <keylock hobtid="72057594228441088" dbid="7" objectname="Table1" indexname="Index1"
                   id="lock448e2c580" mode="X" associatedObjectId="72057594228441088">
            <owner-list>
              <owner id="process5844bc8" mode="X" />
            </owner-list>
            <waiter-list>
              <waiter id="process5827708" mode="RangeS-S" requestType="wait" />
            </waiter-list>
          </keylock>
          <keylock hobtid="72057594228441088" dbid="7" objectname="Table1" indexname="Index1"
                   id="lock2ba335880" mode="RangeS-S" associatedObjectId="72057594228441088">
            <owner-list>
              <owner id="process5827708" mode="RangeS-S" />
            </owner-list>
            <waiter-list>
              <waiter id="process5844bc8" mode="X" requestType="wait" />
            </waiter-list>
          </keylock>
        </resource-list>
      </deadlock>
    </deadlock-list>
  </TextData>
  <TransactionID />
  <LoginName>xx</LoginName>
  <StartTime>2010-09-07T11:27:47.867</StartTime>
  <ServerName>xxx</ServerName>
  <LoginSid>xxx</LoginSid>
  <EventSequence>116538375</EventSequence>
  <IsSystem>1</IsSystem>
  <SessionLoginName />
</EVENT_INSTANCE>

SP1 正在执行从 5 个不同表(Table1 到 Table5)(使用内部查询等)获取数据的选择。SP2 对 Table1 执行更新。
有趣的是,SP2 更新的列之一是 Table1 中的外键字段和 Table2 的主键,而 Table1 和 Table2 都是 SP1 的 select 语句的一部分,不确定这是否相关但不想错过任何事物。

注意:indexname="Index1"(在上面的死锁图中)——Index1 与 Table1 中的外键和 Table2 的主键位于同一列。

4

3 回答 3

2

查看此MSDN 文章,其中指出:

隔离级别具有连接范围的范围,一旦使用 SET TRANSACTION ISOLATION LEVEL 语句为连接设置,它就会一直有效,直到连接关闭或设置另一个隔离级别。当连接关闭并返回池时,将保留上一个 SET TRANSACTION ISOLATION LEVEL 语句的隔离级别。重用池连接的后续连接使用在连接池时有效的隔离级别。

问题是连接以 Serializable 隔离级别打开;关联的事务被释放,连接也是如此,但连接没有被破坏并进入连接池。下一次发出连接请求(使用相同的连接字符串)时,这个连接将被返回,并且由于查询没有指定任何隔离级别,它在 Serializable 隔离级别中执行。

基本上,如果你有一个连接池并以特定的隔离级别打开一个连接,比如说 Serializable,那么连接将返回到隔离级别设置为 Serializable 的池。下次您请求连接时,您无法确定不会返回此连接,因此即使默认隔离级别为 ReadCommitted,您也可能会获得这些“可序列化”连接之一。

另一个需要注意的是,每次将隔离级别设置为可序列化(或其他任何东西)时,您可能会选择不同的连接,并且通过将隔离级别设置为可序列化(或其他任何东西)慢慢地您可能会污染连接池中越来越多的连接你设置)。

我没有找到任何机制来重置处理连接(当它在执行我的查询后返回连接池时)。一种解决方法是显式重置每个连接的隔离级别。但这很乏味。

所以最好的选择是为不同的隔离级别创建单独的连接池

于 2012-04-02T09:47:10.557 回答
1

在 sp1 中的那些选定表之后添加 with(nolock) 以确保不能向这些特定表添加读锁。

于 2011-04-08T06:27:26.200 回答
0

我知道在某些情况下,非聚集索引会导致SELECTandUPDATE语句之间出现死锁,听起来这可能与您的情况有关。有关更多信息,请参阅这些链接:

于 2011-04-10T04:12:24.683 回答