我有一个 spark (1.2.1 v) 作业,它使用postgresql.Driver for scala将 rdd 的内容插入到 postgres 中。在 postgres 中,我有一些函数,例如“ CDB_LatLng ”,需要由插入触发(该特定函数计算 CartoDB 表的“the_geom”列)。
我想使用 COPY 将数据插入到 postgres:
def copyIn(url: String, username: String, password: String, tableName: String, reader: java.io.Reader, columnStmt: String = "") = {
//connect to postgres database on the localhost
val driver = "org.postgresql.Driver"
var connection:Connection = null
Class.forName(driver)
connection = DriverManager.getConnection(url, username, password)
try {
connection.unwrap(classOf[PGConnection]).getCopyAPI.copyIn(s"COPY $tableName ($columnStmt) FROM STDIN (FORMAT CSV, DELIMITER ';'))", reader)
} catch {
case se: SQLException => println(se.getMessage)
case t: Throwable => println(t.getMessage)
} finally {
connection.close()
}
}
squares_rdd.foreachPartition(iter => {
val sb = new StringBuilder()
var keys : String = ""
iter.foreach(row => {
val mapRequest = Utils.getSquaresInsertMap(geoSelectMap, row)
val mapValues = mapRequest.values.mkString("; ")
sb.append(mapValues).append("\n")
if(keys == ""){
keys = mapRequest.keySet.mkString(", ")
}
})
copyIn(url, username, password, squares_table, new StringReader(sb.toString), keys)
sb.clear
})
当我尝试使用它时,我收到一个错误,即列“the_geom”无法接收字符串数据“CDB_LatLng(x,y)”... COPY 命令应该触发触发器,如文档中所述的 INSERT 命令,所以有可能在 COPY 内的列上使用函数以及如何使用?