Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
所以我有一组文件归档在 HDFS 中,文件名中有一个唯一的键。我在 HIVE 表中有一个具有相同唯一键的记录表。
我将如何向其他用户提供对文件的访问权限?我可能需要限制对某些用户的访问。
我正在考虑提供对 hive 表中文件的引用。
我还可以查看某种用于搜索下载文件的 Web 界面。
每次执行查询时,Hive 都会启动一个 MapReduce 作业(或多个)。通过设置和拆除 MapReduce 作业引入的延迟超过了 Web 界面预期响应性的任何可接受标准。
我建议您将文件的元数据保存在关系数据库中。你必须有一个关系数据库,比如 PostgreSQL,来存储 Hive 元数据。我当然希望您不要为此使用默认的 Derby!