我一直在寻找一种方法来保护 Parquet 文件,按列,用于 Spark 访问。理想情况下,这将与Apache Ranger为 Hive 工作的方式相同,即系统管理员为不同的组和列定义访问策略。
我一直在通过 Hortoworks HDP 尝试 Ranger,但是,Spark 和 Parquet 的插件似乎还没有。
我还能够使用Apache Drill和视图设计一个解决方案,但是,目前还不能接受,主要是因为社区对 Drill 的支持仍然很少。
有没有人面临同样的要求和/或有一些解决方案的方向?