问题标签 [presto]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
presto - 无法在 Presto 中运行查询
我是第一次安装 presto。我在 amazon ec2 中创建了一个 ubuntu 实例,并安装了安装 presto 所需的所有依赖项。我关注了 https://github.com/facebook/presto。
我做了 git clone 并获得了源代码,然后$mvn clean install
按照说明运行。然后我跑了$presto-cli/target/presto-cli-*-executable.jar
。执行查询时显示错误,如下图所示
请帮我解决这个问题。我想在包含主服务器和从服务器的集群中尝试相同。
oracle - PrestoDB 可以连接 Oracle 等关系型数据库吗?
如果 presto 能够连接 Oracle 或 Mysql,请告诉我如何连接。
hadoop 2.1.1 hive 0.12.0 presto 0.65 java jdk 7 oracle 10g
hive - Presto 集群无法对配置单元定义的表运行查询 - “没有可用于运行查询的节点”
我正在运行一个指向 EMR 上的 hive 的 2 节点 presto 集群,该集群配置了 S3 上的数据。
配置单元元数据是可见的;在 CLI 中,我可以描述(表)claim1,并查看有关它的元数据。
两个节点在 sys.node 表中都显示为活动的。
当我运行查询(select count(*) from claim1 where col1='M')时,我看到协调节点上有很多日志记录,最后是:
...或交替:
非协调节点有时(但并非始终如一)在其日志中获得几行:
cassandra - 使用 cassandra 实时处理大数据
我正在为销售人员开发应用程序。我无法弄清楚如何在我的应用程序中管理大数据。以下是场景。
我根据以下标准划分了位置。
Country => State => City => Territory => Area => Outlet。
我管理日常销售的表格结构大致如下。
插座 ID - 1,2,3,4,5,6 ...
用户 ID - EMP001,EMP002,EMP003,EMP004,EMP005,EMP006 ...
产品编号 - 78,54,21,11,09,83 ..
数量 - 12,34,67,43,70,03 ..
日期和时间 - 01/05/2014 – 11.00,01/05/2014 – 12.00,01/05/2014 – 14.00 ..
和其他文件。基于上述数据结构,将有许多实时查看的报告。
我们每天有 100 万行插入。我已经将 Casandra 缩小为 NO-SQL 数据库。
现在我需要一个可以查询和管理实时分析的数据库。听说并阅读了这些开源工具,例如 - Hbase、Pig、Hive、Presto DB、Impala、Sharp、Shark 等。
目前,我无法判断哪个最适合我的实时分析和预测产品销售应用程序。
您的帮助和指导将不胜感激。
谢谢
presto - 同时将 hive 和 cassandra 连接到 presto
如果我具有相同的数据库名称,是否有任何可能的方法可以同时连接 hive 和 cassandra。?我需要同时访问 hive 数据库和 cassandra 键空间中的表..
感谢和问候帕万·查克拉瓦蒂
java - 来自 cassandra 连接和使用 presto 查询的 java.sql.SQLException
我使用 CQL 准备了一些带有 cassandra 的表。事实上,我尝试对我的数据应用聚合查询(sum、avg 等)。所以,我在 java 中使用了 presto-cassandra。我已将 presto 配置如下:
配置属性:
JVM.properties:
日志属性:
节点属性:
cassandra.properties:
然后,我一直在尝试连接到 presto 并通过 jdbc 运行一些查询,但我不断收到错误消息。代码是:
此外,maven 依赖项如下所示:
但是当我运行这段代码时,我得到:
问题是什么?
oracle - 哪个 Hadoop 组件可以处理所有的 oracle 查询。?
哪个 hadoop 组件可以处理所有的预言机功能并且具有低延迟.. 我正在考虑使用 Presto、Drill 和 Shark 等组件.. 谁能说出上述哪种技术可以以低延迟处理预言机中的所有功能..或者至少哪个具有更高的兼容性并且可以处理oracle的所有功能。我可以灵活地使用一种以上的技术,但是对于使用哪种技术兼容哪种技术以及哪种技术可以提供低延迟感到困惑。 .?
cassandra - 无法在 Presto 中使用 Cassandra 连接器
我已经设置了 Cassandra,并且我已经创建了一个键空间(mykeyspace)和一个表。我将 Cassandra 作为服务启动,在 presto 安装文件中添加了这样的 cassandra.properties 文件:
在此之后,我在 Presto 中发出了这个命令,我认为它正在连接到 Cassandra 数据:
但是,现在,当我发出命令“显示表”时,我收到以下消息:
我真的很感激任何帮助来清除这个错误。
cassandra - 无法连接到 Presto 中的 Cassandra
我已经设置了 Cassandra,并在其中创建了一个 keyspace('mykeyspace') 和一个表。我将 Cassandra 作为服务启动,在 presto 安装文件中添加了这样的 cassandra.properties 文件:
在此之后,我在 Presto 中发出了这个命令,但我不确定它是否连接到 Cassandra 数据:
现在,当我给出命令“显示表”时,我得到了这个异常消息:
尝试查询的所有主机都失败(尝试:localhost/127.0.0.1(com.datastax.driver.core.TransportException:[localhost/127.0.0.1] 无法连接))
我使用 cqlsh 在 cassandra 的“mykeyspace”中查看创建的表,因此确保 cassandra 正在运行。
我真的很感激任何帮助来清除这个错误。
hadoop - 从 Presto HIVE_CURSOR_ERROR 中的表中获取数据时出错
我们在单节点服务器上使用 Prestodb(0.69) 和客户端。我们在哪里使用 hive 目录,表为 ORC 格式,由 350,000,000 行组成。
在运行查询“select column1 from ORC_Table1 where column2=123456789”时,我们得到了 HIVE_CURSOR_ERROR。column2 的数据类型是“int” 下面是错误堆栈:-
查询在由几行组成的表上运行良好。谁能帮我解决这个问题。
下面是 config.properties: