1引言
长期以来,无论是制造厂还是用户,单纯追求性能的观点占据主导地位,“产品性能好则说明其质量好”,对整流设备的效能及寿命周期费用不够重视。实践表明,整流设备在化工行业、金属冶炼、金属加工等行业应用,各项性能指标已非主要矛盾。国产的整流设备在使用中因电气元件损坏、印制板虚焊、接插件不牢靠等影响正常运行的故障或事故较多,产品故障维修率较高,由于设备本身设计或制造缺陷或元部件质量问题所导致的事故时有发生,设备的可靠性已成为主要矛盾。因此,开展整流设备可靠性设计,在此基础上评估可靠性以及分析各种影响可靠性的因素具有重要的工程实用价值。
可靠性设计是根据可靠性指标预计的结果,在设计过程中选用与系统可靠性匹配的器件及技术,以达到满足产品可靠性的要求,同时使产品生命周期费用最低。常采用的可靠性设计技术包括简化设计、降额设计、冗余设计、热设计、电磁兼容设计、维修性设计、容错设计与故障弱化设计等,有些还包括软件的可靠性设计。
研究表明,在产品设计的初期开展可靠性工作,费用支出最少[1]。世界知名的大公司非常重视产品设计阶段的可靠性分析,他们把对可靠性的朴素的经验性的认识提高到理论高度,其质量手册中有专门的可靠性分析章节,要求对设计方案的每一环节都进行可靠性分析,并在此基础上确定最终的技术路线。
2整流设备可靠性模型
2.1 整机可靠性模型
电控类设备一般为可修复系统,单元寿命服从指数分布。
一般地,整流设备可以简单地分为控制系统和功率系统两个单元。但在大功率整流设备中,水冷系统的重要性是不言而喻的,在进行可靠性分析时,可将水冷系统单独作为一个单元进行分析。因此,整机可靠性模型如下:
2.2 控制单元可靠性模型
控制单元的可靠性包括硬件可靠性和软件可靠性。只有当软硬件都正常时,控制单元才能正常工作,因此,我们可将软件和硬件看作是一个串联系统,见图2。
图2 控制单元软硬件串联模型
控制单元的可靠度:
软件可靠性同样是一个随机过程,可用概率分布来描述。但软件可靠性与硬件可靠性的分析有本质的不同:首先,硬件失效的根源通常是老化引起的物理变质,而软件缺陷一旦被发现,通常能够被永久性修复;其次,硬件可靠性理论通常依赖于对静态过程的分析,软件由于其复杂性和人为因素以及操作过程的影响,使得基于静态过程的理论分析不适于软件所表现出来的动态现象[2]。目前,关于软件可靠性的模型有40多种,我们采用对数——指数模型来研究软件可靠性[3],其可靠性指标的计算公式为:
控制单元使用的元器件较多,其硬件组成可以依据功能划分为:电源模块、信号调理模块、数字IO模块、调节模块、现场总线模块、脉冲放大模块、人机接口等。其硬件可靠性模型如下:
图3 控制单元硬件串联模型
控制单元的硬件可靠度:
2.3功率单元可靠性模型
功率单元包括硅元件、散热器、脉冲变压器、过压保护器件等,考虑存在冗余情况,其可靠性模型见图4所示,我们可视其为k/n系统,即n个单元中有k个或k个以上单元正常时,系统正常。
其可靠度为:
式中,RT为每套硅组件的可靠度。
图4 功率单元可靠性模型(k/n系统)
若不存在冗余支路,则可靠性模型见图5所示。这种情况下,其可靠度为:
(n为硅组件数量)
图5 功率单元可靠性模型(无冗余)
2.4 水冷单元可靠性模型
水冷单元包括水管、纯水装置、水泵、压力表、水温表、变频器(如果有)等,它属于串联模型。我们可用元件计数法来进行可靠性预计,其失效率为:
3整流设备可靠性指标及分配
整流设备所服务的对象往往是不间断生产模式,比如电解铝行业和氯碱化工行业,一次不间断运行的时间往往可达半年之久,若按180天计算,即设备要连续运行4320小时。
系统可靠度指标Rs取0.9,计算可得整流设备的平均无故障时间为:
在确定了设备的可靠性指标后,我们可按照加权因子分配法将系统的可靠性指标分配到设备的分系统,直到最小单元[1]。
根据产品的组成和使用特点,可靠性指标分配主要考虑以下问题:
- 分系统的重要程度及分系统对系统失效的影响程度
- 分系统的复杂程度
- 分系统所处工作环境对系统的影响程度
- 维修性因素
- 元器件质量因素
- 标准化因素
表1 加权因子分配法计算表
可靠性指标分配公式为:
式中:θj——第j个 分系统平均无故障工作时间;
θs——整机平均无故障工作时间;
Kji——第j个分系统的第i个加权因子;
N——分系统数量
若要求整机平均无故障时间达到41000小时,则各单元分配的可靠性指标为:
控制单元:
功率单元:
水冷单元:
4整流设备可靠性设计要点
① 简化设计
可靠性设计的第一准则是越简单越可靠。一台大型的整流设备元件数量较多,每个元件都对设备的可靠性产生直接影响。以我们所设计的控制器为例,第一次的设计方案中,元件数量较多,预计的综合失效率较高。在此基础上,进一步采用高可靠性的大规模集成电路芯片替代分立元件,减少不必要的A/D支路和I/O支路,并把所有调节功能软件化,大大的简化了硬件电路的设计和组件单元间的串联关系,有效的提高了控制单元的可靠性。相关数据见表二。
表二 两种设计方案对比
设计系列 |
元件数量 |
综合失效率 |
I型设计 |
1376 |
1.187×10-5 |
II型设计 |
1021 |
8.094×10-6 |
② 冗余设计
冗余设计是用一台或多台相同单元(系统)构成并联形式,当其中一台发生故障时,其它单元仍能使系统正常工作的设计技术。冗余按特点分为热冗余储备和冷冗余储备;按冗余程度分,有两重冗余、三重冗余、多重冗余;按冗余范围分,有元器件冗余、部件冗余、子系统冗余和系统冗余。
在整流设备的控制单元中,若单通道控制器不能满足系统可靠性要求,控制单元中重要的功能组件可采用冗余设计方案,如测量单元、调节单元、电源系统等。控制单元的冗余模型见图6所示。
图6 控制单元的冗余模型
需要指出的是,冗余设计增加了任务可靠性,但降低了基本可靠性。以现有的设计技术、计算机软硬件技术和微电子技术,数字调节器单通道已能满足设备可靠性要求。单通道可靠性越高,并联冗余的效果越不明显。
③电磁兼容性设计
电磁兼容性是指设备在电磁环境中正常工作的能力。电磁干扰不仅影响设备的正常工作,甚至造成设备中的某些元器件损害。因此,对电磁兼容技术要给予充分的重视。电磁兼容性设计主要包括以下各项:
1)抑制骚扰源
——限制骚扰源的电压、电流变化率;
——限制骚扰源的电压、电流幅?;
——限制骚扰源的频率;
——直流电源的去耦;
——交流电源变压器的电磁屏蔽;
——对感性负载的骚扰源采取相应措施;
——采用独立电源。
2)切断干扰的耦合通道
——完整的电磁屏蔽以切断空间干扰的耦合通道;
——合适频谱的滤波以切断线路传导干扰的耦合通道;
——适当的接地以降低地线干扰的耦合通道;
——采用适当的导线以传输不同性质的信号;
——注意元器件的布局,以降低干扰耦合;
——应用布线技术,以降低干扰耦合;
——采用电磁、光电、机械等隔离技术,切断干扰的耦合通道。
3)提高敏感电路的抗干扰能力
——选用具有高抗干扰能力的元器件;
——采用完整的电磁屏蔽;
——采用合适的滤波技术;
——限制电路的带宽;
——采用合理的去耦措施;
——采用合理的接地。
4)电磁兼容性试验验证
电磁兼容性试验验证可以参照相应的国家标准进行。
④降额设计
元器件在使用或贮存过程中,总存在着某种比较缓慢的物理化学变化。这种变化发展到一定程度时,会使元器件的特性退化、功能丧失,即失效了。而这种变化的快慢,与温度和施加在元器件上的应力大小直接相关。为此,应当对元器件实行降额设计。
图7是晶闸管基本失效率曲线[4]。由图可见,晶闸管失效率随着电压应力比的降低而减小,随着温度的升高而增大。一般情况下,我们取电压应力比S=0.4,若管壳温度为60℃,其失效率为6×10-7。
图7 晶闸管基本失效率曲线
⑤ 热设计
晶闸管的热设计基于其额定工作电流、过负荷电流和暂态故障电流,目前晶闸管实际的制造水平是:导致永久性损坏的极限结温为300~400℃,承受最严重故障电流下的最高短时允许结温为190~250℃。研究表明:温度每提高10℃,元器件失效率提高1倍,这就是有名的“10℃法则”。因此,一般推荐晶闸管正常工作范围的允许结温为125℃。需要指出的是,元件均流系数应作为热设计的主要输入条件之一。
5结束语
对整流设备的可靠性进行了探讨,给出了分析整流设备可靠性的基本模型和可靠性指标以及指标分配的基本方法,简述了提高设备可靠性的设计要点。整流设备的可靠性是设计出来的、生产出来的,可靠性设计必须与功能设计同步进行,因此,设计人员必须明确可靠性设计的目的并掌握可靠性设计的方法。可靠性定量活动应当贯穿于产品研制的全过程,包括可靠性分析、预计、论证、指标的确定和分配、设计、制造、调试检测和维护使用等。在设计中,必须贯彻和执行可靠性设计的技术标准和规范、产品可靠性要求事项、可靠性工作计划和可靠性审查程序等管理措施。
应强调的是,任何产品初期的可靠性不可能达到预期的水平,都需要一个经过不断地采取各种纠正措施的增长过程。可靠性增长应当把握以下3个主要因素:产品的信息反馈,特别应该重视用户的意见;产品可靠性故障的检测与分析;采取相应的纠正措施并进行试验验证。