小艺是怎样炼成的？华为端侧大模型交卷

作者：于佳卉

2023-10-31

“

在这场大模型竞赛中，华为走在了前列。

手机＋大模型，这是当下最火热的技术赛道之一。各大手机厂商谁也不想掉队，纷纷推出自己的AI大模型。

比如vivo即将在开发者大会上揭晓搭载大模型的新机，OPPO已经启动了基于AndesGPT大模型的新小布1.0 Beta版公测，小米也宣布将小爱同学升级为AI大模型，并招募测试用户。

而在这场大模型竞赛中，华为显然走在了前列。早在8月初，华为在开发者大会上发布的新一代智能操作系统HarmonyOS 4就接入了AI大模型，小艺成为首个具有AI大模型能力的终端语音助手。

搭上大模型，语音助手终于“智能”了

这也是目前大模型与手机结合的主要方式，围绕着语音助手做创新，让它们更加智能。这一点，手机厂商们已经形成共识，华为率先交出了答卷。

华为在盘古L0大模型的基础上，专门针对终端消费者场景中涉及的数据进行了精细的调优，构建出一个L1层对话模型，应用到了小艺身上。

华为形容，大模型版小艺“更聪明、更能干、更贴心”，这三个特点具体体现在以下几个方面：

第一，智慧交互更聪明。过去，语音助手常被诟病语义理解困难、回答过于机械化。现在有了AI大模型的支持，小艺能够通过自然语言对话理解并执行用户的指令，而无需用户说出标准的功能名称。对于不熟悉手机操作的老人，这种适老化的设计提供了极大的便利。

小艺还可以处理更加复杂的场景编排任务，用户可以一次性给出一系列指令。例如用户说：“晚上12点后设置免打扰，但如果是妈妈来电让我听到，7点叫我起床，下雨则提前半小时叫醒，上午10点提醒我参加会议，中午12点到2点设为静音。”小艺会经过逻辑推理后快速创建相应任务。

第二，高效工具更能干。大模型是一个提高生产力的工具，现在有了大模型的加持，小艺也可以帮助我们在平时的工作中提升效率。比如为用户提供文本生成、摘要总结、多语种翻译等功能，此前余承东就在微博分享了小艺生成的开发者大会文案。

用户可以通过自然语言描述让小艺快速查找文件或图库中的特定图片，它还能识别图片中的信息并提供相应服务，如识别海报上的活动地址并进行导航，或根据车辆照片识别车型。甚至，用户给它一张表格图片，小艺就能将数据整理为Excel文档。

第三，私人助手更贴心。随着小艺与用户相处的时间越来越长，它就会越来越懂你，这是在语言理解能力和生产力之上更长足的进步。它能记录你的琐事和灵感，了解你的日常偏好和习惯，逐渐从通用变得专属，成为一个真正的私人助手。

举个例子，当你出去旅游，如果你爱看小说，路上小艺就会给你推小说阅读，到了地方，如果你爱吃，它会给你推当地美食，如果你爱逛，它给你推当地景点。再往前一步，想象一下，如果日后小艺被应用到华为的全屋智能场景中，是不是有些贾维斯入户的意思了。

把大模型放进手机分几步

手机上使用大模型已经不是什么新鲜事了，像ChatGPT、文心一言都推出了APP，相信有很多人都尝试过，但这些应用都是依赖云端算力。而现在的趋势是，手机厂商正在努力使大模型直接在手机终端运行。这样做的原因是什么？

一方面，随着设备和数据流量的快速增长，以及数据中心成本的攀升，云端的算力需求变得越来越大，已经难以继续满足。而且，现代人们手机不离身，手机涉及到大量的个人信息。如果这些信息被上传到云端，就会存在信息安全隐患。

因此，利用手机等终端的闲置算力资源，不仅可以为大模型提供更高效的运行环境，还能确保用户数据的安全。此外，移动终端丰富的应用场景也为大模型提供了更多的应用可能性。

另一方面，手机终端本身也迫切需要大模型来提升用户体验。华为终端BG AI与智能全场景业务部总裁贾永利指出，大语言模型具备泛化能力，能够帮助手机智能助手提升理解能力。另外，大模型Plug-in的插件能力，可以在手机内部打通各应用之间的壁垒，借助工具拓展能力。

所以，大模型与手机终端是“双向奔赴”。

然而，大模型以其千亿级的参数量和高昂的运行成本著称，如何在功耗仅有几瓦的手机上运行这样的模型？

第一步，端云协同的混合架构是关键。模型训练需要大量算力，适合在云端完成，而手机端主要负责推理，只需激活模型的部分模块和神经元。简单任务直接在手机端完成，复杂任务则调用云端资源。这种端云协同不仅需要端侧模型处理个性化数据，还要考虑到端侧的算力和功耗限制，从而依赖云侧模型。这其中如何分配任务、协调配合、保护数据隐私等，都是对厂商技术的考验。

以华为为例，小艺背后的大模型拥有端侧和云侧两种形态，可以针对不同设备和场景的需求进行处理。端侧大模型会对用户请求和上下文信息做预处理，然后把需求发送到云端，最大化地发挥“端侧快”和“云侧强”的优势。华为自研的通用大模型和自有云计算业务，为端云协同提供了基础支撑。

第二步，升级手机操作系统，节能提效。大模型需要和手机操作系统深度结合，才能提供系统级的体验。华为从底层重构了大模型与语音助手的协作系统，摒弃了过去多个系统独立构建的“割裂”模式，让大模型成为智慧系统的大脑，对系统进行全面增强。

华为终端业务软件部总裁龚体表示，“相比传统的PC或者服务器，移动终端最大的挑战就是如何平衡好体验和能耗，这是鸿蒙内核设计最重要的核心点之一。”华为在软件系统上做了很多优化和协调，让大模型在手机上运行更高效、更节能。

第三步，压缩模型规模，降低算力需求。通过剪枝、量化和蒸馏等模型压缩与加速技术，给大模型减重。然后再根据手机终端的特点和需求，让大模型针对性学习数据和知识。比如华为就让小艺重点学习了对话、设备操作、购物、生活常识等内容。并且还对提示词和输出格式进行了逐字分析和压缩，将推理时延减少了一半。

为了让大模型在用户端得到广泛应用，除了前述这些，背后还有许多技术和产业层面的挑战需要攻克，但华为已经证明了它的可行性。

而且，近两年全球智能手机市场低迷，大家都没什么动力换新机。据Counterpoint Research最新数据，今年第三季度全球智能手机销量同比下滑8%，创下十年来该季度的最低水平。

在这种情况下，手机厂商迫切需要一个新的卖点来吸引消费者，AI大模型的崛起为厂商提供了一个绝佳的机会。

本文章选自《AI启示录》杂志，阅读更多杂志内容，请扫描下方二维码