问题标签 [spark2.4.4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-spark - 蜂巢直线和火花负载计数与蜂巢表不匹配
我正在使用 spark 2.4.4 和 hive 2.3 ...
使用 spark,我使用 DF.insertInto(hiveTable) 将数据框加载为 Hive 表
如果在运行期间创建新表(当然是在通过 spark.sql 插入插入之前)或由 spark 2.4.4 创建的现有表 - 一切正常。
问题是,如果我尝试加载一些现有表(创建 spark 2.2 或更早版本的旧表) - 面临 COUNT 条记录的问题。通过直线与 spark sql 完成目标配置单元表的计数时的差异计数。
请协助。