我查看了开发人员指南,但没有找到答案。到目前为止,我能够将 CSV 和 ORC 文件从 HDFS 加载到 Vora,但能够从 Hive 加载?
在没有将 Hive 指定为源的情况下,我尝试使用等于 /apps/hive/warehouse/tablename/00000_0 的“路径”(或任何部分文件名)。但是,如果 Hive 表由 /tablename/ 目录中的多个文件表示,我必须在“路径”中明确列出它们,这不是一个理想的选择。有没有更好的办法?
更新:这个问题的上下文是,虽然 Vora 不提供数据持久性,但我想使用 Hive 仓库作为持久性层,最终仍然是文件,但有一些额外的组织。在 SAP 生态系统中使用 Hadoop,我可以利用带有 Hive 适配器的 SAP 数据服务将文件从外部加载到 Hadoop(如果需要,将数据从 Hadoop 转储到文件中),并通过 Vora 提供这些数据。