0

我正在尝试通过 Drill-embed 测试 apache Drill,但我所有的 json 文件都是带有 jl.gz 文件扩展名的 jsonline 文件。

如果我将它们重命名为 json.gz 它可以工作,但在我的情况下这是不可取的。

我怎么能告诉钻 jl.gz 文件实际上是 json?

PS:我尝试将 a 添加bootstrap-storage-plugins.json到 $CP 但钻嵌入似乎没有读取它。

4

1 回答 1

0

是的,不要使用自举。这仅适用于分布式环境,建议使用Web 控制台或 REST API 。毫无疑问,必须压缩 gz 文件,而不是具有 gz 扩展名的解压缩 JSON 文件。根据默认的 dfs 存储插件创建一个新的存储插件配置,例如 myplugin。

  1. 启动 Drill shell 并转到http://<IP address or host name>:8047. 在工具栏中选择存储。dfs 存储插件配置出现在默认配置列表中。
  2. 在 Storage 选项卡上的 Enabled Storage Plugins 下,单击 UPDATE 以复制 dfs 存储插件配置。插件的配置出现。
  3. 复制配置并返回(只需取消配置)。
  4. 在存储选项卡上,在新存储插件中输入名称。例如,输入 myplugin。每个在 Drill 上注册的配置都必须有一个不同的名称。名称区分大小写。
  5. 单击创建。
  6. 在配置中的格式部分,更改 json 格式以指定扩展名:“gz”

    “json”:{“类型”:“json”,“扩展”:[“gz”]},

  7. 单击创建。

现在,在 Drill shell 中,您可以查询名为 something.gz 的 JSON 文件:

use myplugin;
select * from `/Users/me/donuts.gz` limit 2;
于 2015-10-21T13:47:37.990 回答