11

我想了解通过 RJDBC (重新)使用与 MS SQL 数据库的 SQL 连接的最佳实践是什么。

我可以想象三种可能的情况:

  1. 将连接存储在全局变量中,初始化一次,在代码中随处使用
  2. 为每个请求创建一个新连接
  3. 做一些更复杂的事情,例如预先填充一个开放连接池,并根据需要(重新)使用池中的连接。

我在一个有几十个客户端的闪亮应用程序中使用我的代码,如果我使用方法 1,我担心会发生不好的事情。所以我使用方法 2,使用下面的代码为每个请求创建一个新连接。

我可以看到这种方法的一些潜在缺点:性能、对数据库资源征税等。但我可能过于谨慎,因为 R 是单线程的,即使在闪亮的使用场景中也是如此?

所以我的具体问题是:

A. 我可以在我闪亮的应用程序中通过 RJDBC 安全地使用与 MS SQL 数据库的单一连接吗?

B. 在上面的场景 2 中是否有任何真正的缺点(内存泄漏、性能等)?


NewConnection <- function() {
  file = NULL
    # make it work on three different OSes - Linux, MacOS, Windows 
    for (path in c('/Users/victor/Documents/R/sqljdbc_3.0/enu/sqljdbc4.jar',
          '/home/oracle/sqljdbc_3.0/enu/sqljdbc4.jar',
          'C:/Projects/jdbc/sqljdbc_4.0/enu/sqljdbc4.jar')) {
      if (file.exists(path)) {
        file = path
          break
      }
    }
  if (is.null(file))
    return(NULL)
  else {
    drv <- JDBC("com.microsoft.sqlserver.jdbc.SQLServerDriver", file)
      passwd <- GetUserNamePassword()
      conn <- dbConnect(drv, "jdbc:sqlserver://sql.server.address.com", 
          passwd$username, passwd$password)
      return(conn)
  }
}

PS 相关:如何在 R 包中管理数据库连接

4

2 回答 2

1

每次建立连接时考虑幕后发生的事情可能会有所帮助:

  • 必须建立 TCP/IP 连接(包括 DNS 查找和联系 SQL Server Browser 以获取命名实例的正确端口号)
  • 用户需要经过身份验证和验证才能被授权连接
  • 必须保留用于连接的服务器端资源(私有内存等)

因此,限制应用程序使用的连接数量是有意义的。

如果您的应用程序按顺序执行所有事务,您应该打开一次连接并重用它。为基于服务器的多用户应用程序使用连接池。

于 2013-11-29T11:43:49.473 回答
1

许多问题:

1)重用连接比每次使用都建立新连接更快。根据您的代码,这将稍微加快您的应用程序。但是重用连接更复杂。这就是为什么许多人使用连接池的原因。

2) 如果您的程序运行时间很短,您可以使用一个连接,例如在一个全局变量中。如果您的应用程序是服务器应用程序(长时间运行),那么您需要保持连接,因为服务器可以关闭连接,如果没有人使用它,因为连接上没有流量。这可能发生在服务器应用程序的夜间。连接维护功能是连接池的一部分。

概括。如果您的应用程序是简单的,不是多线程的,不是服务器应用程序,那么重用您的单个连接。否则,每次使用新连接或使用连接池。

于 2013-11-20T21:53:02.827 回答