容错计算硬件容错方法

容错计算硬件容错方法由于软件的费用越来越高,停机时间造成的损失越来越大,维修投资越来越多,而硬件的成本越来越低,故以Stratus为代表的硬件容错技术在80年代初开始出现

某些计算机厂商为了提高产品可靠性,采用了如“磁盘镜象”、“数据重读”等一些容错技术,但这些产品都还不能称作是容错系统

真正意义上的硬件容错系统应该具有以下5个特性:(1)双总线体系结构;(2)双重冗余部件:CPU、内存、通讯子系统、磁盘、电源……;(3)自检逻辑排除故障;(4)自动隔离故障部件;(5)联机更换故障部件

具体地说就是,双总线及双重冗余部件确保了系统在某一部分发生故障时仍能“生存”下去并不会降低或失去其处理性能;每个模块在运行时都不断检查自身的状态,如果发现任何部件发生故障,系统会将该部件自动隔离

并立即将故障信息自动通过远程服务网,转达到用户服务中心,此时其余部件仍将会继续运行;能在线更换或扩充部件,而不影响系统的正常运行

当系统发生故障时,硬件容错结构不需要从故障中恢复

任何故障元件都自动退出操作,而系统则利用冗余部分继续运行,用户不需要设计恢复程序

对用户来说,硬件容错计算机和传统计算机一样,并不必为容错而特别编程 

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关