1

在过去的几周里,我一直在创建能够复制数据库的通用脚本。目标是能够在某个服务器上指定任何数据库并将其复制到其他位置,并且它应该只复制指定的内容。要复制的确切内容在配置文件中指定。该脚本将用于大约 10 个不同的数据库并每周运行一次。最后,我们只复制了大约 3%-20% 的数据库,这些数据库大到 500GB。我一直在使用 SMO 程序集来实现这一点。这是我第一次使用 SMO,我花了一些时间来创建复制模式对象、文件组等的通用方法。(实际上帮助找到了一些糟糕的存储过程)。

总的来说,我有一个工作脚本缺乏性能(有时会超时),希望你们能提供帮助。当执行 WriteToServer 命令复制大量数据(> 6GB)时,它达到了我的 1 小时超时时间。这里是复制表数据的核心代码。该脚本是用 PowerShell 编写的。

$query = ("SELECT * FROM $selectedTable " + $global:selectiveTables.Get_Item($selectedTable)).Trim()
Write-LogOutput "Copying $selectedTable : '$query'"            
$cmd = New-Object Data.SqlClient.SqlCommand -argumentList $query, $source
$cmd.CommandTimeout = 120;
$bulkData = ([Data.SqlClient.SqlBulkCopy]$destination)
$bulkData.DestinationTableName = $selectedTable;
$bulkData.BulkCopyTimeout = $global:tableCopyDataTimeout # = 3600
$reader = $cmd.ExecuteReader();
$bulkData.WriteToServer($reader); # Takes forever here on large tables

源数据库和目标数据库位于不同的服务器上,因此我也跟踪了网络速度。网络利用率从未超过 1%,这让我感到非常惊讶。但是当我只是在服务器之间传输一些大文件时,网络利用率会飙升至 10%。我尝试将 $bulkData.BatchSize 设置为 5000,但没有真正改变。将 BulkCopyTimeout 增加到更大的数量只会解决超时问题。我真的很想知道为什么网络没有被充分利用。

还有其他人有这个问题吗?任何有关网络或批量复制的建议将不胜感激。如果您需要更多信息,请告诉我。

谢谢。

更新

我调整了几个提高 SqlBulkCopy 性能的选项,例如将事务日志设置为简单,并为 SqlBulkCopy 提供表锁而不是默认的行锁。此外,某些表针对某些批量大小进行了更好的优化。总体而言,复制的持续时间减少了约 15%。我们要做的是在不同的服务器上同时执行每个数据库的副本。但是在复制其中一个数据库时,我仍然遇到超时问题。

复制一个较大的数据库时,有一个表,我一直得到以下异常:

System.Data.SqlClient.SqlException: Timeout expired.  The timeout period elapsed prior to completion of the operation or the server is not responding. 

它在开始复制表后大约 16 分钟被抛出,该表不在我的 BulkCopyTimeout 附近。即使我得到了表最终被完全复制的异常。此外,如果我截断该表并仅为该表重新启动我的进程,则这些表将被复制而没有任何问题。但是对于那个表来说,复制整个数据库的过程总是失败。

在复制该错误表之前,我已尝试执行整个过程并重置连接,但它仍然出错。我的 SqlBulkCopy 和 Reader 在每个表之后都关闭。关于还有什么可能导致脚本每次都失败的任何建议?

CREATE TABLE [dbo].[badTable](
[someGUID] [uniqueidentifier] NOT NULL,
[xxx] [uniqueidentifier] NULL,
[xxx] [int] NULL,
[xxx] [tinyint] NOT NULL,
[xxx] [datetime] NOT NULL,
[xxx] [datetime] NOT NULL,
[xxx] [datetime] NOT NULL,
[xxx] [datetime] NULL,
[xxx] [uniqueidentifier] NOT NULL,
[xxx] [uniqueidentifier] NULL,
CONSTRAINT [PK_badTable] PRIMARY KEY NONCLUSTERED 
(
[someGUID] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON) ON [PRIMARY]
) ON [PRIMARY]

目标数据库上没有此表的索引。

4

3 回答 3

0

我使用了一个数据集,想知道这是否会更快:

$ds=New-Object system.Data.DataSet
$da=New-Object system.Data.SqlClient.SqlDataAdapter($cmd)
[void]$da.fill($ds)
bulkData.WriteToServer($ds.Tables[0])
于 2010-12-16T18:59:41.767 回答
0

您是否考虑过删除索引,进行插入,然后重新索引?

于 2010-12-17T22:28:11.297 回答
0

SqlBulk Copy 是迄今为止将数据复制到 SQL 表中最快的方法。
您应该获得超过每秒 10,000 行的速度。
为了测试批量复制功能,请尝试 DBSourceTools。( http://dbsourcetools.codeplex.com )
该实用程序旨在将数据库脚本写入磁盘,然后在目标服务器上重新创建它们。
复制数据时,DBSourceTools 会先将所有数据导出到本地 .xml 文件,然后再批量复制到目标数据库。
这将有助于进一步确定您的瓶颈在哪里,通过将过程分为两遍:一遍用于读取,另一遍用于写入。

于 2010-12-21T02:46:38.743 回答