我正在尝试通过 Drill-embed 测试 apache Drill,但我所有的 json 文件都是带有 jl.gz 文件扩展名的 jsonline 文件。
如果我将它们重命名为 json.gz 它可以工作,但在我的情况下这是不可取的。
我怎么能告诉钻 jl.gz 文件实际上是 json?
PS:我尝试将 a 添加bootstrap-storage-plugins.json
到 $CP 但钻嵌入似乎没有读取它。
我正在尝试通过 Drill-embed 测试 apache Drill,但我所有的 json 文件都是带有 jl.gz 文件扩展名的 jsonline 文件。
如果我将它们重命名为 json.gz 它可以工作,但在我的情况下这是不可取的。
我怎么能告诉钻 jl.gz 文件实际上是 json?
PS:我尝试将 a 添加bootstrap-storage-plugins.json
到 $CP 但钻嵌入似乎没有读取它。
是的,不要使用自举。这仅适用于分布式环境,建议使用Web 控制台或 REST API 。毫无疑问,必须压缩 gz 文件,而不是具有 gz 扩展名的解压缩 JSON 文件。根据默认的 dfs 存储插件创建一个新的存储插件配置,例如 myplugin。
http://<IP address or host name>:8047
. 在工具栏中选择存储。dfs 存储插件配置出现在默认配置列表中。在配置中的格式部分,更改 json 格式以指定扩展名:“gz”
“json”:{“类型”:“json”,“扩展”:[“gz”]},
单击创建。
现在,在 Drill shell 中,您可以查询名为 something.gz 的 JSON 文件:
use myplugin;
select * from `/Users/me/donuts.gz` limit 2;