我正在尝试从 Superset 连接到 Apache Solr 数据源。据我了解,Solr 是用 Java 编写的,而 Superset 是用 python 开发的,并且 SqlAlchemy 中没有 Solr 的方言。
问问题
896 次
2 回答
2
您不能开箱即用地为 Solr 创建 Superset 数据源,因为(就您而言)Solr 没有 SQLAlchemy 方言。
请注意,SQLAlchemy(或 Superset)不会关心该数据源是否是用 java(或 Fortran 编写)——只要有一个功能性的 SqlAlchemy 方言和 Python 驱动程序。
话虽如此,Solr 不存在 SQLAlchemy 方言的原因是它们建立在不同的目的和基于不同的结构上。
您最好的选择可能是实施某种类型的数据提取过程,从 Solr 中获取您需要的数据,并将其放入支持的数据库中。
于 2017-12-15T23:33:53.420 回答
1
绝对地。您可以使用 Spark-Solr 并运行 Spark Thrift 服务器并将您的超集与 Thrift 服务器连接。这个堆栈对我有用。
Spark Solr是 github 的链接
Spark Solr 是一个强大的库,可以从 Solr 索引创建数据帧。您甚至可以编写流式表达式来加入多个集合。Spark Thrift 提供到 Spark 引擎的 JDBC 连接。
于 2019-10-14T10:35:13.337 回答