问题标签 [beeline]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - 使用 beeline 在远程 impala 上运行一些 sql 失败
当我使用此命令时出现错误:
错误:AnalysisException:无法解析表引用:“arcaccessdenied”(状态=HY000,代码=0)
如何解决这个问题?
hive - 有没有办法阻止直线生成 CR 字符?
当我将 beeline 的输出重定向到一个文件时,我可以看到生成的文件有 ^M(CR,回车,0x0D hex)字符,该字符位于第 144 列附近,大概是作为环绕文本输出的一种方式。
有没有办法在直线中关闭它?或者可能通知直线不同的列宽。
我有:Beeline version 1.2.1000.2.5.0.0-1245 by Apache Hive
hive - 使用 hive 生成 Parquet 文件
我正在尝试使用 hive 生成一些镶木地板文件,为此我从一些 .tbl 文件中加载了一个常规的 hive 表,通过 hive 中的这个命令:
创建表区域(R_REGIONKEY BIGINT,R_NAME STRING,R_COMMENT STRING)
以“|”结尾的行格式分隔字段 存储为文本文件位置 '/tmp/tpch-generate';
在此之后,我只执行这 2 行:
创建表 parquet_reion LIKE 区域存储为 PARQUET;
插入 parquet_region select * from region;
但是当我检查 HDFS 中生成的输出时,我没有找到任何 .parquet 文件,而是找到了 0000_0 到 0000_21 之类的文件名,并且它们的大小总和比原始 tbl 文件大得多。
我在做什么错了?
hive - 文本格式文件上的 Hive Load Data Inpath 覆盖导致重复的 SKEY 列值
尝试通过直线将格式良好的 ~80GB 文本文件(CHR 01 分隔)加载到 Hive 中:
该表是使用正确/适当的架构和数据类型(100 列)创建的,具有以下参数:
加载数据时,似乎所有列都具有正确的信息 - 至少与输入的数量级相同(数百万条记录),列中值的采样与预期值匹配;但是第一列(巧合的是,SKEY)被严重重复 - 因为它被应用于第一次出现以下的记录。
变成:
任何人都有克服这个问题的经验,或者对根本原因有所了解?我相信我可以使用另一种格式(即/AVRO)获得更好的结果,但这有点不令人满意。
将文本文件导入 Hive 是否有最大限制?
hadoop - 使用 SSL 的直线查询(Hive 错误配置?)
我正在尝试使用 Kerberos 进行直线查询的集群:
但我得到这个错误:
我真的不知道怎么了。它正在另一个集群上工作,但不在这个集群上。Hive 日志说:
请问什么会产生校验和失败?
hadoop - .beeline 与 .hiverc 的用途相同吗?
我的办公室目前正在从蜂巢式过渡到直线式。
我目前有一个 .hiverc 文件,可以为我加载一些 JAR 文件,如果可能的话,我想将 .hiverc 中的所有内容转换为直线。
目前,我的目录中唯一看起来相关的文件是 .beeline(除非我正在寻找 .beelinerc,哈哈)。Beeline 是否支持 .hiverc 文件支持的配置单元?
.hiverc 内容:
apache-spark - Beeline 和 Spark-SQL 上的查询
我是使用直线运行查询的新手,但为什么运行一个简单的查询需要这么多时间SELECT count(*) from table1 [having data of 7,000,000 records]
?
我们什么时候使用beeline
而不是,Spark-SQL
反之亦然?
谢谢
bash - 如何处理直线外壳中的错误
我创建了一个 shell 脚本来调用beeline shell。但是,如何在以下两种情况下处理直线外壳中的错误。
1) 如果假设beeline shell 中有任何连接错误,它应该在日志文件中打印错误消息。
2) 如果假设beeline shell 命令有错误,那么它应该在日志文件中打印相应的错误消息。
任何人都可以帮助我解决同样的问题...
hive - 错误:使用 hive2 运行简单计数(*)时
我明白了
我已经hive-serde-2.1.1.jar
从 intellij 添加。如果我运行select * from <table>
它会给我结果,但如果我运行select count(*) from <table>
我会得到上述错误。谁能帮我这个 ?
更新:我从 yarn-gui 得到这个堆栈跟踪
hive - 如何在直线上列出今天或最近几个小时内创建的表格?
我正在使用直线,没有特殊的管理权限。是开发者账号。有什么方法可以让我看到今天在特定模式下或在过去几个小时内创建的表列表?谢谢你。如果您需要任何进一步的信息,请告诉我,再次感谢。