魔搭ModelScope开源社区
2022年云栖大会,达摩院联合CCF开源发展委员会共同发起了国内首个中文Al模型开源社区“魔搭"(ModelScope),将达摩院近五年潜心研究的600个优质模型,向全中国的Al研究者与团队开放,共同促进中国的Al基础研究。作为发起者之一,达摩院向魔搭社区开放了一批高质量的初始模型,同时,作为社区的一分子,达摩院更希望与学界和企业一起,通过开源社区的共建,推动模型应用生态繁荣发展,丰富技术生态,共同将我国的人工智能创新推上新的台阶。
战略规划
近年,A|研究发展迅猛,不断拓宽以数字化、智能化推动数实融合的空间,但Al应用始终存在使用门槛过高、场景结合不足等难题。数据的复杂性和稀缺性,以及模型训练高难度与高成本,令模型训练(尤其是大模型的训练)在国内仍未得到普及。另外,模型的定制化对开发人员要求高,且目前在国内没有一个通用的模型交流平台,缺乏一个系统化的模型分享渠道。为此,魔搭ModelScope开源社区应运而生,唯有开源,才能降低大模型的研究门槛;也唯有开源,才能推动一系列基础研究的开拓和发展;唯有开源,才能为数实融合注入新动力。
业务模式
当前,魔搭ModelScope社区上架模型超过700个,覆盖了视觉、语音、自然语言处理、多模态等Al主要领域,覆盖任务超过60个。其中包含几百个SOTA(业界领先)模型和几十个预训练大模型,均已开源代码或开放使用。ModelScope社区兼容了各种机器学习的框架,开发者可以快速接入各种模型。目前,社区上也集合了很多来自高校,企业的优秀模型。
技术架构
ModelScope社区提供了一站式的模型服务,包括模型的管理、下载、调优、训练、部署一体化能力,社区提供非常丰富的模型以及对应的版本管理能力。社区也提供一个在线体验的能力,在不开发代码的情况下,能够让众多使用者能够快速体验各种模型的效果。除了模型以外,社区同时还提供了丰富的数据集。为了构建这些完整的平台体验,ModelScope提供了一个功能强大的开源Python package,这个package提供了不同模型接入Model Scope生态的接口和实现,底层能够兼容各种机器学习框架,无缝衔接模型应用与开发。
转型成效
(一)企业价值:
提供高效便捷工具,提高经营效率。通过模型开源的方式,给阿里巴巴集团内部提供了全套模型即服务的工具,让集团各个部门能够更加高效便捷地研发、使用新技术,通过人工智能创新和变革工作模式,包括生产经营成本下降、协同效率提升、产品质量提升、流程优化、经济效益增加。通过提供基础模型,让人工智能算法架构趋于统一,统一底层算法架构为下一代通用人工智能系统提供了条件。
(二)社会价值:
共享技术红利,实现绿色节能。魔搭ModelScope社区为科研工作者提供了最前沿的开源模型,丰富数据集以及共享交流的平台,对开发者提供了一系列开发者支持计划,开发者可以免费获取算力、Al教程,可以快速上手进行学习和实践。魔搭社区开源了一系列预训练大模型,让广大企业尤其是中小企业,不需要在基础模型训练上投入大规模算力和数据,而是基于预训练模型,用小规模算力和数据训练下游任务,丰富场景运用的实例,在全社会层面减少算力损耗,实现绿色节能。
魔搭模型开源社区的主要发起方,阿里巴巴集团达摩院,一直致力于通过技术的应用和研发,提高智能产品的渗透率,通过开源共享的技术,推动产业智能化升级。在人工智能技术方面,达摩院建设了完整的基础Al能力:深度学习、语音、 NLP、视觉、优化等,并通过开源社区魔搭ModelScope社区开源开放了760个各种模态的模型,覆盖视觉,语音,自然语言处理,多模态,Al for Science等,在主要的Al技术赛道上达到世界先进水平。
本文章选自中国上市公司协会发布的《中国上市公司数字化转型典型案例》