我想尝试开发一种可以处理所有人工智能和其他计算内容的冗余自动驾驶汽车计算架构。为此,我购买了一些包含集成 GPU 的边缘计算设备(Nvidia Jetson TX2s)。然后我用千兆以太网交换机将它们连接起来,现在我可以与它们通信了。
我需要你对系统架构的建议。如何实施这个故障安全、安全关键和冗余系统?有一些集群示例可提供高可用性。但我想这样做:“每个计算节点运行相同的进程,然后将结果输出到主节点。主节点分析并投票结果并选择最好的。如果计算节点失败(错误、系统停机、缺电等) ),系统应该意识到故障并将故障节点的计算负载转移到健康节点。每个节点还应该运行一些节点特定的任务,而不受协作进程的影响。
你的想法是什么?任何关键字、建议、方法推荐都对我有帮助。