据我了解,HDFS 对于非结构化和大量的数据很有用。我想知道,是否可以将 HDFS 与 Teradata 一起使用,因为 Teradata 是 RDBMS,因此不是非结构化的?
另外,HDFS 是如何与数据库结合起来的。是文件系统包含数据还是简单来说它是如何工作的?谢谢
使用 Teradata DB 本身 - 不。
但是:),Teradata 提供所谓的UDA(统一数据架构),其中 Teradata、Aster DB 和 Hadoop(HDFS) 相互连接,几乎可以无缝地协同工作:)。
通常,如果您只想处理非结构化数据,请选择 Aster。它是 Teradata 的产品,您可以直接与 HDFS 连接。HDFS 在这里用作廉价且快速的数据存储。
更有趣的解决方案将出现新的 Aster 版本 (6),其中将实施AFS(Aster 文件系统)。ASR 是类似于 HDFS 的分布式文件系统。我也期待尝试一下;)
在 xhudik 的答案中添加更多细节。
要将 Teradata 与 Hadoop 连接,您需要一个连接器。一种是用于 Hadoop 的 Teradata QueryGrid。它是 Teradata DWH 的插件并连接到 HCatalog。HCatalog 连接到 HDFS。
您还可以使用 Teradata Connector for Hadoop,它是一个 SQOOP 扩展,因此您可以从 Hadoop 连接到 Teradata。