Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
Foundry Data Connection 中可用的两个 S3 源选项之间有什么区别?
是摄取镶木地板文件的首选吗?
通过 Hadoop 的 S3 是目前经过最佳测试且最灵活的 S3 选项,但大量文件的性能非常差。
S3 Direct 是使用 Amazon S3 开发工具包直接从 S3 读取的,其性能明显优于 Hadoop,因为它需要O(1)而不是O(number of files)网络调用。
O(1)
O(number of files)
我们建议尽可能使用 S3 直接源。