在我的组织中,我们有一个使用 HTTP 和 SSL 的 Spark Thrift 服务器设置,因为有一个基本假设是二进制模式没有通过网络安全加密,因此可能会泄露凭据或敏感查询数据。
我已经用Google搜索过,扫描阅读了一篇研究论文并查看了 Thrift 协议规范以寻找明确的答案,但无济于事。似乎完全没有提及身份验证和加密意味着它应该由一个封装的网络层来处理?
二进制模式下的 Spark Thrift 服务器传输未加密或其他不安全数据的假设是否正确?
在我的组织中,我们有一个使用 HTTP 和 SSL 的 Spark Thrift 服务器设置,因为有一个基本假设是二进制模式没有通过网络安全加密,因此可能会泄露凭据或敏感查询数据。
我已经用Google搜索过,扫描阅读了一篇研究论文并查看了 Thrift 协议规范以寻找明确的答案,但无济于事。似乎完全没有提及身份验证和加密意味着它应该由一个封装的网络层来处理?
二进制模式下的 Spark Thrift 服务器传输未加密或其他不安全数据的假设是否正确?
Thrift 协议确实包括低级传输:
在 Spark Thrift 服务器的上下文中,这可以在hive-site.xml
文件中启用,如下所示:
<property>
<name>hive.server2.use.SSL</name>
<value>true</value>
</property>
结合默认的 TCP Thrift 协议,这确实加密了 thrift 协议流量。这方面没有很多明确的文档,但由于 Spark Thrift 服务器是 Hive2 服务器的一个分支,我发现这是关于设置 Hive2 服务器的,这意味着这是可能的:
最后一个问题似乎是某些工具,尤其是 Power BI 似乎无法将 SSL 用于“标准”(TCP Thrift 协议)连接。