根据此页面:https ://spark.apache.org/sql/您可以通过 ODBC 或 JDBC 将现有的 BI 工具连接到 Spark SQL:
我不是说鲨鱼,因为这基本上是EOL:
正是出于这个原因,我们将在 Shark 中作为一个单独的项目结束开发,并将我们所有的开发资源转移到 Spark SQL,这是 Spark 中的一个新组件。
BI 工具(如 Tableau)如何通过 ODBC 连接到 Shark sql?
随着 Spark SQL 1.1 的发布,您还可以使用节俭的 JDBC 驱动程序,请参阅https://spark.apache.org/docs/latest/sql-programming-guide.html#distributed-sql-engine
Simba 提供 Databricks 使用的 ODBC 驱动程序,但这仅适用于 Databricks 发行版。我们将于明天(12 月 3 日,星期三)在www.simba.com上发布与 Apache 一起使用的公共版本。然后,您将能够下载并试用用于 Tableau 的驱动程序。
请看一下:http ://www.openstratio.org/blog/connecting-to-the-stratio-big-data-platform-using-odbc-2/
Stratio 是一个包含经过认证的 Spark 发行版的平台,允许您将 Spark 连接到任何类型的数据存储库(如 Cassandra、MongoDB...)。它有一个 ODBC 驱动程序,因此您可以编写将转换为 Spark 作业的 SQL 查询,或者甚至更快地直接查询 Cassandra - 或您想要连接到它的任何数据库 - 如果可能的话。这样,将 Tableau 连接到 Spark 和您的数据存储库非常简单。如果您需要任何帮助,我们将非常乐意为您提供帮助。
免责声明:我是 Stratio 的 ODBC 开发人员之一
正如 Carlos 所说,Stratio Meta 是一个模块,在不同的持久层(目前只有 Cassandra 和 Mongo,短期内还有 HDFS)上充当解析器、验证器、规划器和协调器层。该模块提供了一个带有类 SQL 语言的 Shell、一个 Java/Scala API、一个 REST API 和 ODBC(简称 JDBC)。它还使用了另一个 Stratio 模块 Stratio Deep,它允许我们使用 Apache Spark 以高效、快速的方式执行查询。
免责声明:我目前受雇于 Stratio Big Data
对于 Azure HDInsight 上的 Spark,您可以按照https://azure.microsoft.com/en-us/documentation/articles/hdinsight-apache-spark-use-bi-tools/此处所述连接 Tableau(或 PowerBI) 。ODBC 驱动程序在这里:http ://www.microsoft.com/en-us/download/details.aspx?id=47713