容错计算软件容错方法

容错计算软件容错方法70年代中期出现了新的容错方法

它采用多处理器和特别设计的操作系统来达到容错

避免了上一代容错系统处理器的主从关系及连接至所有子系统的双路径

更重要的是.新方法在商业应用中第一次提供联机修理功能,即故障部分的移出和更换都不影响正在运行的应用程序

具有这种性能的系统的主要结构特点包括处理器重复、双存取输入输出控制器、冗余电源系统和一个以信息为基础的操作系统

这种以软件为基础的容错系统以检查点为最基本的恢复机能

每一个运行中的进程都在另一处理器上备有完全相同但并不活动的后备进程

如原进程内发现不能恢复的故障,则后备进程可用来替换它

原进程定时将关键计算点通过消息方式送到后备进程

若操作系统发现原进程失效

则“唤醒”后备进程,后备进程可从最后一个检查点开始恢复计算

检查点是一个简单概念,但其有效地在应用系统中使用则需有高度的编程技巧和对系统的详细了解,而且对计算机系统的资源消耗比正常大25%

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关