希捷——冲击制造业AI最前沿
希捷制造工厂中的机器人
大数据、分析与人工智能(AI)早已在金融服务及电子商务领域得到广泛应用,但在制造业企业中却鲜见踪影。除了预测性维护等少数用例之外,很少有制造企业拥有将分析及AI应用于关键业务流程的数据储备与分析人才。
希捷技术公司是一家市值超100亿美元的数据存储与管理解决方案供应商,他们的表现为制造业企业的前沿科技应用之路奠定了基础。希捷在制造工厂中部署有大量传感器,并在过去五年中一直使用这部分数据保障并改善制造流程的运行质量与效率。
希捷制造分析体系中的一大核心,在于对硅晶片进行视觉检测自动化,确保使用良好的元件制造磁盘驱动器磁头及芯片。在整个晶圆制造过程中,希捷会收集到大量显微镜图像,能够借此检测晶圆内部瑕疵并监控制造工具集的运行情况。由全球晶圆系统高级总监Sthitie Bom领导的工厂控制团队,使用这些图像素材中的数据建立起一套自动故障检测与分类系统,能够直接从图像当中检测并分类晶圆制造缺陷。此外,希捷还使用多种图像分类模型检测显微镜图像中的失焦情况。
基于深度学习算法,这些ADC(自动缺陷分类)模型于2017年底首次完成部署。在此之后,图像检测功能被大规模推向美国及北爱尔兰的晶圆制造工厂,帮助希捷通过节约人力成本、提升良品率获得数百万美元的收益。除了减少人员需求之外,这项技术的引入还帮助希捷提高了制造流程效率。几年之前,希捷的视觉检测准确性还仅为50%,但现在已经超过90%。
希捷的另一项成功尝试,是将整个工厂内的传感器数据整合起来。Bom及其全球晶圆系统小组一直倾向于采用开源解决方案;但这一次,他们选择与智能运营平台厂商Savigent Software合作,将来自各处工厂内多台机器上的传感器数据集成起来以供分析使用。Bom的小组也成为希捷内部第一个使用Hadoop存储数据、以供分析及AI应用程序使用的团队。
模型可解释性方面的挑战
虽然希捷在制造分析与AI应用等多个领域取得了实质性进展,但仍有一大难题始终得不到解决。考虑到工厂内部署有大量传感器与计量工具,工程师往往会在警报中发现一些难以避免的误报。传感器读数中的瞬态故障往往难以察觉,而且由于大多数生成警报的图像识别功能源自深度学习模型,导致工程师根本无法理解这些复杂的系统到底如何、以及为何发出警告。因此,唯一的办法就是投入大量时间进行全面的传感器与故障读数调查。为此,分析小组目前开始向工程师提供警报评分,借此预测传感器发生故障的概率。然而,这种评分本身是如何得来,又成了新的谜团。
Bom的小组正在努力增强模型的可解释性。事实上,这类问题在其他深度学习环境中同样屡见不鲜。为此,她的小组希望在数据科学层面探索AI模型可解释性的答案。在适用的场景下,该小组会使用Shapley值,一种评估博弈论模型中某些特征所产生的具体影响的方法。这种方法在相对简单的模型中效果不错,但目前要将其应用于深度学习模型,仍会造成高昂的额外计算成本。
第二种方法是在现实场景中对可解释性进行更实际的处理,包括建立治理框架——使用三种不同的性能指标将标准软件工程实践扩展为模型行为控制方法。这三种指标分别为:
- 运行时错误监控——在生产部署的模型中监控、诊断、解释及警告运行时错误的标准日志记录系统;
- 模型性能监控——人机回圈界面,供领导专家对算法决策结果做出验证,并在数据集上寻找可能解释模型决策合理性的支持证据;
- 后果指标监控——这些指标将衡量在采用机器学习决策后,可能受到负面影响的其他因素——例如元件良品率。
这三大治理支柱能够帮助我们解释并理解现有模型做出错误决策后可能引发的后果,了解模型性能何时下降,并在必要时及时执行人机回圈验证。
除了采用数据科学与可解释性治理方法之外,Bom的团队还与希捷创新中心Lyve Labs开展合作。位于以色列的Lyve Labs是希捷公司的创新中枢,于2020年2月正式启动,负责与初创企业生态系统建立合作伙伴关系以实现外部技术创新。他们还与美国及英国各学术机构紧密合作,开发出能够在各类状况间建立因果关系的模型。即使未能实现全面自动化,其仍然能够显著加快对问题根本原因的分析速度。
引领明尼苏达州各高科技制造企业间的AI合作
Bom意识到,她的团队在实际工作中遇到的不少AI与分析挑战,绝非希捷公司的特例。为此,她开始与明尼苏达州各高科技制造商合作(希捷在这里拥有广泛的制造业务布局),希望确定对方如何应对这些问题。希捷于2019年10月联手Savigent同各合作伙伴组织了一场为期两天的基准会谈,专门探讨AI技术对于制造业企业运营方式的影响。
Bom介绍称,在本次会议上,她从其他公司身上学到了两大基本观念。首先就是“将数据分析融入血液”,这也是希捷长期以来的运营理念。去年,IDC发布的一项调查显示,企业错失可用数据信息的比例高达68%。在她看来,凭借以往在数据结构化、清洗与大众化推广方面投入的资金,希捷拥有“非常强大的数据基础设施”,因而能够建立起更精简高效的模型开发流程。Bom还认为,与其他参会企业相比,希捷拥有更多样化的AI产品组合。希捷目前在视觉检测、时间序列领域以及软件感知(即同时测量并分析来自多个传感器的数据时)方面都已经有所部署。
其他参会者也对希捷的AI探索赞赏有加。凭借着将基于深度学习的视觉检测机制集成到晶圆制造工厂内,希捷赢得了2018年由明尼苏达州技术协会颁发的Tekne新兴技术大奖。希捷还在其晶圆工厂中部署了云AI动态故障检测方案,借此在2019年获得爱尔兰制造业研究奖。凭借一系列大获成功的概念验证,整个制造行业开始认真关切并投资于AI领域。但在实际推行中,企业往往发现AI扩展总会带来意外难题——希捷成功实现AI部署的巨大价值正在于此。希捷公司制程工艺与系统副总裁Matt Johnson总结道,“将AI/ML技术整合至核心晶圆监控系统当中,有助于加快发现问题的速度,同时也减少了持续监控所需要的人力资源,最终显著提高我们为下游部门提供的晶圆质量。”
Sthitie Bom将团队的成功归结于大家追求价值、不断创新以及远见卓实的坚毅精神。小组正一心一意推动AI技术在制造体系内的应用,并不断将其拓展到更多具体工程领域。
Bom和她的小组无疑代表着正确的前进方向,也用真实案例证明企业在探索及动用AI力量方面的不懈追求,将给高科技制造业带来何等巨大的变革。
本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码