可靠性工程——成功之路

来源:百度文库 编辑:神马文学网 时间:2024/04/28 12:42:28
2006-06-09   王永坤   点击: 663
可靠性工程——成功之路
很多公司都曾经发生了或正在发生着这样一种情况,市场上,客户对产品不断发生的故障抱怨不断,对反复发生的问题更是暴跳如雷和无可奈何;而营销人员在旁如坐针毡,走也不是,不走也不是,恨不得找个人狠狠打一顿。他们往往第一个想到的是为什么生产这样差,这帮人都是干什么的。
很自然,有问题的产品源源不断地返回公司,进行修理和返工。曾经有这样一家公司,是国内著名企业,98年的时候,市场竞争加剧,但质量没有控制好,产品返修率高达6%,那一年,也不知为什么,产品问题不断,几个产品线都有问题,以至临时存放的仓库都放不下。此事上报老板,要求老板增加仓库,老板到仓库现场一看,十分触动,密密麻麻,到处都是,果然再不增加仓库就没有地方了。老板正在为日益被对手蚕食的市场而寝食难安,更加被眼前的景象刺激。不改变是没有出路了。
老板经过多日苦思冥想,决定全面变革,引进国际管理咨询公司,为公司诊断,下猛药。同时成立多个改进小组,分头实施。事后证明,该老板是十分英明的。
其中的一个小组,是进行失效分析,为什么失效,找到真正原因。
该小组首先从电路原理进行分析,找到失效单元,再确认失效元件,用各种物理化学手段,分析元件,找到失效机理,研究并验证该元件的失效机理,是ESD,MSD,EOS还是其他原因导致的损伤,最后根据元件规格和现场条件判定该元件是否被可靠地使用,从而找到真正的原因。经过大量的分析后,基本所有的元件都被分析到,自然形成了一个失效案例数据库。这样,每个设计工程师在使用一个库里的元件时,都预先知道了该元件曾经的失效经历,从而能够在设计时提前考虑,加以预防。这就是器件级DFMEA。前后经过7年的实践,该公司取得了巨大成就,产品可靠性达到世界一流水平,遥遥领先于国内对手。国际市场则所向披靡,令对手胆寒。
现在我们来看看产品可靠性的全过程是什么样的。我们可以用一个图来做一个整体描述:

要设计生产出可靠的产品,需要从整个流程考虑问题。方案选型是第一步,也是最重要的一步。往往我们都会栽在这一步。产品可靠性的50%是由元件本身的可靠性决定的,30%是设计过程决定的,20%是制造、运输和使用决定的,当选型不慎,使用了不成熟的方案和器件,设计和生产再努力,也是没有用。在竞争日益激烈,价格战不断的消费电器领域,很多公司经不住短期的困难,往往冒险使用供应商新推出的更低成本方案,短时间内,产品很快占领市场,也赢得一些利润,殊不知,危机已经潜伏下来。常见的现象就是,刚开始轰轰烈烈,皆大欢喜,没多久,也就2-3个月,大量的产品开始出现这样那样的故障,售后部门像无头苍蝇,到处灭火,设计人员被各种求救电话折腾得没有脾气,极大地消耗了各方士气,刚到手的微薄利润也在无声无息中悄悄流失。而事情并没有到此为止,连绵不断的返修、投诉,导致顾客怨声载道,骂声一片,最后连累该公司的所有产品,销量下滑,利润下滑,顾客流失,老板心急如焚,但也没有办法。
如果就此能够吸取教训,从此严肃对待此事,未必不是一件好事,但事实上,“好了伤疤忘了疼”是常见现象。过不了多久,又回到老路上,继续重复着,产品始终在低水平上运行,问题不断重复,市场越来越小。
这里有一个数据:方案(器件)选型,IBM需要1-2年时间,才能决定是否使用,一旦确定,必签定严格苛刻的质量协议,如有违反,将遭到最多10倍损失的罚款。本文开头提到的公司原来是2-4周时间来认证,最后经过改进,3-6个月。选型的重要性已经被国际公司证明是严肃和关键的。
提高产品可靠性接下来就是设计过程。这个过程就是可靠地使用元件的过程。要想真正可靠设计,并用好辛辛苦苦选定的元件,设计人员应当掌握14门设计课程:可靠性预计,FMEA,QFD,EOS防护设计,ESD防护设计,容差设计,降额设计,升额设计,热设计,信号完整性分析,EMC设计,安全设计,环境适应性设计,寿命与可维护性设计。
其中最重要的几门课程是:FMEA,QFD,EOS防护设计,ESD防护设计,容差设计,降额设计,信号完整性分析和EMC,安全设计。这些设计课程的知识最终要转化到产品当中,没有这些知识积累,要设计出可靠的产品基本上是靠反复测试修改,人海战术再加上好运气了。
当然这些课程是要靠积累获得的,请外部专家是一个捷径。
设计完成后,接下来就是生产制造,影响制造可靠性的关键环节就是ESD防护、MSD防护以及可焊性问题。ESD不仅在生产线上要注意防护,在仓储、配送各个环节都要注意。MSD是潮湿敏感度的简称,一般IC都是特种塑料封装,由注塑机一次成型,其优点是适合大批量生产,缺点就是气密性差,容易吸收空气中水分。吸收水分的IC在回流焊或波峰焊时,表面的高温会引起水分在极短时间内汽化,引起封装材料应力集中而膨胀变形,变形的封装材料导致IC内引线受力,引起脱焊或虚焊,有的即使没断,但也变形变细,以后在正常使用中,也可能会烧断,严重影响产品可靠性。为了克服MSD的问题,最好是选用MSD等级高的产品,MSD3级的产品,能够使得IC暴露在空气中1周时间而不需要在焊接时进行预处理。而MSD5级的产品,暴露在空气中则仅仅能放置24h,超过24h,必须进行烘烤干燥处理。
可焊性是另一个影响产品可靠性的关键因素,常见的现象是产品在1年左右的使用后,就出现时而正常,时而不正常现象,打开机壳后,并没有元件烧损,仔细检查,往往会发现是可疑元件管脚虚焊,重新补焊后,一切正常。有统计数据表明,CRT电视此类现象占所有返修故障的20%多,是第一位的失效原因。
要提高可焊性首先要元件引脚可焊性提高,经常发现有的元件引脚十分光亮,有的是暗淡无光,有的是银色,有的是灰色,有的表面光滑,有的粗糙,有的粗,有的细,这些不同材质,不同大小的元件在一起,焊接的质量可想而知了。但这种情况往往得不到应有的重视,一旦发生问题,首先认为是生产的问题,其实问题早就发生了,为什么不要求供应商注意呢,但无人关注。尤其是无铅焊接实施后,引脚材料和焊接工艺都发生了变化,可焊性条件需要特别关注。
失效分析,这一步就是针对设计、生产、售后发生的元件失效进行地毯式检查分析,使用各种仪器设备进行检查,透过现象,根据失效机理,找到失效的真正原因。是设计造成的、生产造成的,还是元件本身质量问题,然后改进提高。这个过程需要具有丰富设计经验的工程师主导。常见现象是,采购人员拿到供应商处进行分析,但结论往往都是使用问题,或是敷衍了事,或是不了了之,总之,不是厂家的问题。或许他会悄悄改正,但你不可能得到什么有价值的结果,更无法向他索赔。所有人员都蒙在鼓里,没有积累,没有长进。大多数厂家对失效分析的关注程度很不够,都认为,只要问题解决了,一切都OK了。其实,这里面的经验教训,很多是用多少钱也换不来的,浪费掉,实在可惜。
以上过程是一个产品可靠性的过程。这个过程是一个闭环,是一个稳定的质量改进过程。做好了每个环节,可靠性必将是有很高的保证。
如何做好这个闭环,使得各项工作都有成效呢?这就需要流程保障,IT手段。
流程保障的目的就是不同的人做相同的事,保证有相同或相近的结果,即使错了,也错得一致。流程保障的重点就是做好各个过程关键点的管理和控制,严格输入输出的控制。常见的现象就是说得好好的,写在纸面上,但一旦实施,就是困难重重,这个理由那个原因,总之,不想改变,结果往往是刚开始轰轰烈烈,最后却原地踏步。原因有多种,一个最主要的原因是没有使用IT技术,实际操作中,由于需要大量的文档输出,光靠个人手工,没有资源共享,管理部门面对海量的信息,怎么能够应付过来?由于缺少及时检查督促,工程人员往往由于惰性,而最后放弃变化。另外,工作业绩统计也是需要IT手段,如果能自动生成各种报表,减轻大家的负担,流程就更容易贯彻下去。现在比较流行的就是PDM,ERP。
另一个重要原因就是制度缺乏刚性,害怕工程人员反对,好象工程人员不高兴,制度就是错的。因此,往往制度就是在看脸色中变形而流产的。本文开头提到的公司刚开始实施DFMEA过程中,也有很多工程师不适应,从研发走了很多人,去技术支持的,去销售的,这些人在新岗位上都发挥了很大作用。留下来的,后来补充进来的,都严格按规定操作,结果,实施不到几年,PCB升级次数由5.8降到3.2;产品的返修率从6%降到0.5%。以至后来该公司一线研发人员招聘条件都比以前低,薪水也降了很多。理由是严格按流程做,不需要多么高的知识水平就同样能保证高质量的水准。这个有点像印度的软件工程师,由于印度的软件质量保证工程(CMM)做得非常好,以至家庭妇女都能写上一段标准的代码,完成一个特定的功能。
现在,很多公司在遇到困难时,首先想到的是降低成本、降薪、裁人,但没有想到裁人后怎么办?如果立即行动,建立系统的制度,辅以IT手段,加强内功,以图东山再起,无疑是坏事变好事。可往往是排挤了异己,引进了知己。这样的企业,时常处在一种动荡当中,3个月一小变,6个月一大变,员工茫茫然,领导也是茫茫然。本文开头提到的公司给我们做了一个榜样,98年在公司面临严重危机的关键时刻,下属一家公司以7.5亿美元出售。从上到下,从左到右,各自请业内最好的顾问,强力实施学习和变革,前后总共花掉10亿咨询费。现在,该公司已经成功度过冬天,并迎来果实累累的季节。
作者单位  TTE全球研发中心