0

我正在寻找可以让我逐步学习 Presto 的教程或其他东西。

这个想法是开始集成文件和 MSSQL,这是我的知识领域。不幸的是,由于它是一个相对较新的领域,除了 Facebook 页面或 Presto.io 页面之外我没有找到任何东西,但是对于想要从头开始了解大数据世界的人来说还不够好。

我将感谢您在这方面的帮助和/或指导。

4

1 回答 1

3

Presto 有 2 个主要用例:

  • 查询存储在集群(Hadoop 的 HDFS 上)或云(例如 Amazon S3)中的数据
  • 数据联合,即从多个数据源(例如 HDFS、S3、PostgreSQL 或 SQL Server 等传统 RDBMS)查询(和连接)数据

就 SQL Server 支持而言——Presto 支持连接到 SQL Server,因为https://github.com/prestosql/presto/commit/072440cbb2c8df2a689c4c903dd325013eae41a0

在查询文件时——Presto 使用 Hive 的 Metastore 来跟踪元数据(除了实际读取数据之外的所有内容)。因此,文件必须驻留在 HDFS 或 S3 上才能访问(其他云数据存储,如 Azure 的 Blob,AFAIK,尚不支持

于 2017-02-26T18:09:40.397 回答