我正在使用 HDP 2.4.2 我想将 Spark 与 HAWQ 连接以进行数据摄取。
请让我知道是否有任何推荐/正确的方法,目前我正在使用 postgress jdbc 驱动程序将 spark 与 HAWQ 连接。我面临着这样的问题
- 如果表格不存在,DataFrame 会在 HAWQ 中自动创建表格。
-记录摄取太慢。
- 间歇性地显示错误,例如"org.postgresql.util.PSQLException: ERROR: relation "table_name" already exists"
.