亚信科技欧阳晔:用行业大模型破解企业AI落地难题

作者:赵晓勤
2024-05-22

通用大模型对企业业务理解能力不足,会产生很大的幻觉或偏差,给出的答案并不能很好地支撑业务;此外,企业的数据通常会包含很多敏感信息,直接使用大模型会带来数据泄露和隐私风险;运行和维护 LLM 需要专业知识和技术能力,给企业的IT基础架构以及人员素质提出了更大的挑战。

大模型技术日新月异,不断取得重大突破——能够很好地与人对话,识别人类意图,推理与计算能力不断增强、多模态使其能全方位“理解”世界。大模型(LLM)通过对大量数据的分析发现关联找出规律,在处理如自然语言、图像视觉、翻译等方面取得了不亚于、甚至超越人类的表现。企业如能利用好LLM技术,帮助企业实现更好的预测,将在产品和服务创新、提质增效、提升决策水平、增强竞争力等方面具有广阔的应用前景。

然而,由于通用大模型对企业业务理解能力不足,会产生很大的幻觉或偏差,给出的答案并不能很好地支撑业务;此外,企业的数据通常会包含很多敏感信息,直接使用大模型会带来数据泄露和隐私风险;运行和维护 LLM 需要专业知识和技术能力,给企业的IT基础架构以及人员素质提出了更大的挑战。因此企业需要一个更理解企业业务场景、便于部署、安全且能让业务人员轻松上手的行业大模型产品。

渊思大模型1-3-8产品架构,解决行业最后100米难题

为了避免企业重复建设、解决企业缺少速落地的方法和工具等难题,亚信科技通盘考虑了行业专属、数据安全、持续迭代、综合成本等因素,通过聚焦“平台、模型、工具”三个层面,建立面向行业认知增强的XGPT产品体系,形成了渊思1-3-8的产品架构——即1个通用人工智能与认知增强平台、3个行业大模型和8个认知增强工具。

“‘渊思’由《论语》中记载的孔子的两位学生——颜渊和子思名字组合而成,意为:深入思考、寻根溯源、冷静判断,以此表现亚信科技行业大模型产品的特性和品质”。亚信科技首席科学家叶晓舟教授这样介绍:“为了让企业能够拥有智能化MaaS底座和‘一站式’的企业级AI平台,效弥合通用大模型与行业应用的鸿沟,能够支持异构算力,实现全栈AI技术、开箱即用的MaaS(Model as a Service,模型即服务)服务,渊思·通用人工智能与认知增强平台TAC MaaS应运而生。”

同时降低行业的训练与微调大模型成本,基于TAC MaaS平台首批发布了编程大模型、自智网络大模型与智能运维大模型。渊思·编程大模型有34B与7B两个版本,通过评测其代码质量提升25%的,协作效率提升20%,开发人员的专治度提升50%,大幅提升编程生产效率;IT运维也是企业最重要但也是最头痛的场景,渊思·智能运维大模型,通过6B的参数,可零活适配现场的算力,将运维问答准确率提升90%,让现场工单人工处理量降低20%,通过感知、慧珍、自动调用运维工具和小模型,大幅降低故障排查处理时间,从原来的人工处理需要30分钟,到现在的21秒,将工作效率提升一个数量级;在网络智能化的场景下,自智网络大模型提供了13B/6B两个参数的版本,在通信网络知识评测得分中,比ChatGPT提升45%,理解用户意图准确率达到92%,10分钟内就可生成网络质量的分析报告。可以帮助通信运营商自智网络全面向L4 级加速演进。

针对企业应用的最后100米,亚信科技为企业提供了8个工具,便于嵌入到企业的具体流程和交互场景中,包括:业务智办副驾ChatCRM、自智网络副驾(AN CoPilot)、商业智能增强分析工具产品(ChatBI)、知识对话机器人(ChatBots)、图灵程序员(TuringCoder)、智能运维副驾(Ops CoPilot)、数据管治副驾(DMG CoPilot)。

工程化能力:决定行业大模型成败的关键

亚信科技首席技术官兼高级副总裁、IEEE Fellow欧阳晔博士

当前能提供行业大模型的厂商不在少数,很多企业也在利用开源的框架、开源的大模型利用RAG(信息增强检索)的方式降低幻觉、提升模型准确度,然而提升效果并不明显。在亚信科技首席技术官兼高级副总裁、IEEE Fellow欧阳晔博士看来:“不论是选择行业大模型的供应商还是企业自研大模型,都在考验产品的工程化能力与其带来的商用价值。”

欧阳晔博士进一步解释道:“首先体现在企业在本行业的数据积累,以及强化知识图谱的能力。比如渊思·编程大模型,是亚信科技通过几十年来在软件开发领域积累的十几亿行代码的数据对模型进行微调、不断学习而来,自智网络大模型和智能运维大模型除了利用RAG技术,更多地应用到强化知识图谱的相关技术,通过知识图谱能力结合通用大模型强化知识判别能力,提升大模型的精准度。其次,做好大小模型的融合,2000年以来,企业做了各种机器学习的模型、统计模型、挖掘模型,但今天大模型来了我们不是要丢掉这些小模型,而是充分发挥小模型里积累的数据、与流程业务结合,让大、小模型协作才能解决用户最后100米的问题。”

行业大模型的落地企业也更加关注最后的效果和最终的评估。欧阳晔博士表示,“每一个模型在客户落地的时候都有一个从喂养运营到培育成熟的过程,一般看到效果要经历3个月的优化和迭代时间,就可以得到很好的商用效果。这在亚信科技内部也充分得到验证,这些大模型的面市不是做好了就直接交付给用户,而是首先在亚信科技内部充分使用、不断迭代。此外,评估模型也需要经过第三方的基准测试以及兼容性的测试认证。”

据了解,渊思大模型行已在70+企业得到部署和应用。亚信科技以其深厚的行业经验和技术实力,为企业提供了一套完整的行业大模型解决方案,推动AI技术在各行各业的落地应用。亚信科技正以其敏锐的市场洞察力和创新精神,在AI浪潮中乘风破浪,为我国企业的数字化转型贡献力量。相信未来渊思大模型将会在更多领域发挥其价值,助力企业实现数智化转型升级。

本文章选自《数字化转型方略》杂志,阅读更多杂志内容,请扫描下方二维码

《数字化转型方略》杂志