使用 Spark 1.4.0,我正在尝试使用 insertIntoJdbc() 将来自 Spark DataFrame 的数据插入到 MemSQL 数据库中(这应该与与 MySQL 数据库的交互完全相同)。但是,我不断收到 Runtime TableAlreadyExists 异常。
首先,我像这样创建 MemSQL 表:
CREATE TABLE IF NOT EXISTS table1 (id INT AUTO_INCREMENT PRIMARY KEY, val INT);
然后我在 Spark 中创建一个简单的数据框并尝试像这样插入到 MemSQL 中:
val df = sc.parallelize(Array(123,234)).toDF.toDF("val")
//df: org.apache.spark.sql.DataFrame = [val: int]
df.insertIntoJDBC("jdbc:mysql://172.17.01:3306/test?user=root", "table1", false)
java.lang.RuntimeException: Table table1 already exists.