1) autotest and fault tolerant
自检测与容错
2) fault-tolerant detection
容错性检测
3) error detection and correction
错误检测与纠正
4) error detection and correction
错误检测与校正
5) automatic error dection
自动错误检测
6) distributed and weighed fault-tolerant
分布式加权容错检测
补充资料:容错技术
保证系统在某些组成部分出现故障或差错时仍能正常工作的技术。系统的故障可分为两类:一类是"致命的",不可能自行修复,例如系统的主要部件全部损坏;另一类是局部的,可能被修复,例如部分元件失效、线路故障、偶然干扰引起的差错等。容错技术正是用于构造一种能够自动排除非致命性故障的系统,即容错系统。生物体是高度完善的容错系统。例如人脑的细胞总数为1010个,平均每小时死亡约1000个,一生中死亡约109个,但人的神经系统却能正常工作,而且思维能力不断提高,可靠性日益增大。20世纪50年代中期,J.von诺伊曼提出容错技术中的复合冗余方法。他应用概率论证明了,可以用不甚可靠的器件堆成一个可靠的具有相同功能的组件。同期又出现了莫尔-香农冗余方法。这些研究奠定了容错系统理论的基础。在容错技术中,提高系统工作可靠性的方法主要有自检技术和冗余技术。容错又有多种形式,如硬件容错、软件容错、整机容错、全线容错等。
自检技术 自检指系统在发生非致命性故障时能自动发现故障和确定故障的性质、部位,并自动采取措施更换和隔离产生故障的部件。自检需采用诊断技术,常用专门程序实现,属于程序设计的范围。容错系统的实现要求系统必须具有重复部件或备份部件,或具有不只一个完成某种功能的通道。因此自检技术常配合冗余技术使用。采用计算机的容错系统一般都需要应用自检技术。
冗余技术 冗余可分为硬件冗余(增加硬件)、软件冗余(增加程序,如同时采用不同算法或不同人编制的程序)、时间冗余(如指令重复执行、程序重复执行)、信息冗余(如增加数据位)等。冗余技术中最常用的两种方法是重复线路和备份线路。重复线路指用多个相同品种和规格的元件或组件并联起来,当作一个元件或组件使用,只要有一个不出故障系统就能够正常工作。在并联工作时每一个组件的可靠性概率是互相独立的。备份线路与重复线路的差别是参加备份的组件并不接入系统,只有在处于工作状态的组件发生故障后才把输入和输出接到备份组件上来,同时切断故障组件的输入输出。系统具有自动发现故障的能力和自动转接的设备。若系统的某一组件发生故障使系统出现错误输出,该输出又使重复线路的共同输出产生错误,则并联方式反而降低可靠性。此时可采用备份线路或采用其他规则,例如复合冗余方法和莫尔-香农冗余方法,把组件组合起来,仍能有效地提高系统可靠性。用复合冗余方法构成的复合线路就是由包含多个谢弗门(输入端带有反相器的或门)的随机重复线路的串连。这种方法对可靠性的计算基于元件出错概率服从高斯分布的假定。莫尔-香农冗余方法则用另一种方式组合继电器,用组合概率的方法分析可靠性。两种方法都可以构成同样可靠的线路。当对系统可靠性要求并不十分高而元件可靠性又比较高时,莫尔-香农方法所用元件数比复合冗余方法少很多。当要求系统可靠性很高时,复合冗余方法又较优越。冗余方法提高可靠性的代价是增加了硬件费用。特别是复合冗余方法需要复合成千上万次,例如针对人脑神经系统的计算表明需要用66000个细胞复合代替一个细胞,才能保证不发生误差的间隔为 10000年。随着大规模集成电路的发展,这种设计思想的实际应用已逐步成为可能。而大量采用重复电路和备份电路则早已成为提高可靠性的切实可行的有效方法。对于一定数量的备份元件,使系统可靠性最高的元件组合方式称为最优冗余结构。例如,当元件失效率与所受负荷成正比或有更强的依从关系时,把全部备份元件同时接入工作比当工作元件失效后再依次代换工作的方式可靠性高。
应用 容错技术已获得广泛应用,常用于对可靠性要求高的系统,特别是用于危及人身安全的关键部位。在这些部位大多采用双重冗余,也有采用三重、四重甚至五重冗余的。现代的大型复杂系统常常是容错能力很强的系统。例如苏联"联盟"ΤМ型载人飞船使用了三重冗余的主电气系统以及双重冗余的气动液压管路和生命保障系统。容错技术在计算机中应用得最早和最广泛。50年代初捷克斯洛伐克制造了世界上第一台容错计算机SAPO。60年代美国开始大力研制用于控制航天器发射和飞行的容错计算机。
参考书目
钱学森、宋健著:《工程控制论》,科学出版社,北京,1983。
自检技术 自检指系统在发生非致命性故障时能自动发现故障和确定故障的性质、部位,并自动采取措施更换和隔离产生故障的部件。自检需采用诊断技术,常用专门程序实现,属于程序设计的范围。容错系统的实现要求系统必须具有重复部件或备份部件,或具有不只一个完成某种功能的通道。因此自检技术常配合冗余技术使用。采用计算机的容错系统一般都需要应用自检技术。
冗余技术 冗余可分为硬件冗余(增加硬件)、软件冗余(增加程序,如同时采用不同算法或不同人编制的程序)、时间冗余(如指令重复执行、程序重复执行)、信息冗余(如增加数据位)等。冗余技术中最常用的两种方法是重复线路和备份线路。重复线路指用多个相同品种和规格的元件或组件并联起来,当作一个元件或组件使用,只要有一个不出故障系统就能够正常工作。在并联工作时每一个组件的可靠性概率是互相独立的。备份线路与重复线路的差别是参加备份的组件并不接入系统,只有在处于工作状态的组件发生故障后才把输入和输出接到备份组件上来,同时切断故障组件的输入输出。系统具有自动发现故障的能力和自动转接的设备。若系统的某一组件发生故障使系统出现错误输出,该输出又使重复线路的共同输出产生错误,则并联方式反而降低可靠性。此时可采用备份线路或采用其他规则,例如复合冗余方法和莫尔-香农冗余方法,把组件组合起来,仍能有效地提高系统可靠性。用复合冗余方法构成的复合线路就是由包含多个谢弗门(输入端带有反相器的或门)的随机重复线路的串连。这种方法对可靠性的计算基于元件出错概率服从高斯分布的假定。莫尔-香农冗余方法则用另一种方式组合继电器,用组合概率的方法分析可靠性。两种方法都可以构成同样可靠的线路。当对系统可靠性要求并不十分高而元件可靠性又比较高时,莫尔-香农方法所用元件数比复合冗余方法少很多。当要求系统可靠性很高时,复合冗余方法又较优越。冗余方法提高可靠性的代价是增加了硬件费用。特别是复合冗余方法需要复合成千上万次,例如针对人脑神经系统的计算表明需要用66000个细胞复合代替一个细胞,才能保证不发生误差的间隔为 10000年。随着大规模集成电路的发展,这种设计思想的实际应用已逐步成为可能。而大量采用重复电路和备份电路则早已成为提高可靠性的切实可行的有效方法。对于一定数量的备份元件,使系统可靠性最高的元件组合方式称为最优冗余结构。例如,当元件失效率与所受负荷成正比或有更强的依从关系时,把全部备份元件同时接入工作比当工作元件失效后再依次代换工作的方式可靠性高。
应用 容错技术已获得广泛应用,常用于对可靠性要求高的系统,特别是用于危及人身安全的关键部位。在这些部位大多采用双重冗余,也有采用三重、四重甚至五重冗余的。现代的大型复杂系统常常是容错能力很强的系统。例如苏联"联盟"ΤМ型载人飞船使用了三重冗余的主电气系统以及双重冗余的气动液压管路和生命保障系统。容错技术在计算机中应用得最早和最广泛。50年代初捷克斯洛伐克制造了世界上第一台容错计算机SAPO。60年代美国开始大力研制用于控制航天器发射和飞行的容错计算机。
参考书目
钱学森、宋健著:《工程控制论》,科学出版社,北京,1983。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条