OpenAI在官网宣布新增6个全新微调API功能,以扩展自定义模型,帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。
据悉,Command R+有1040亿参数,支持英语、中文、法语、德语等10种语言。最大特色之一是,Command R+对内置的RAG(检索增强生成)进行了全面强化,其性能仅次于GPT-4 tubro,高于市面上多数开源模型。
在大模型领域英语一直是训练数据最重要的语言,但由于中英文的结构和文化差异,直接将英文数据集翻译成中文并不理想。所以,为了填补高质量中文数据集的空白,研究人员开发出了COIG-CQIA数据集。
华尔街日报科技专栏作家Joanna Stern专访OpenAI首席技术官Mira Murati,讨论全球爆火的文生视频模型Sora。访谈中,Mira回应了Sora的缺点、训练数据来源、上市时间以及生成内容的安全性等问题。Sora存在诸如理解提示文本不准确、物体控制不稳定等问题,且算力需求巨大,短期内不会上市。Sora的训练数据来自Shutterstock,未来可能推出视频修复功能。
2023年大众对AI的看法从怀疑到认可,AGI(通用人工智能)的发展迅速,大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽,创业者面临官方技术迭代的挑战。
Meta宣布了两个新的24K H100 GPU集群,用于训练大模型Llama-3,预计4月末或5月中旬上线。集群使用RoCEv2网络和基于Tectonic/Hammerspace的存储解决方案,支持PyTorch。
马斯克宣布将开源其公司xAI发布的生成式AI产品Grok,一款类ChatGPT产品,提供文本、代码生成等功能,性能超GPT-3.5但弱于GPT-4。Grok-1在多个测试平台表现优异,但仍有局限性,如需内容审核,无独立搜索能力。
阿里巴巴技术团队推出AtomoVideo,一种文本+图片生成高保真视频的模型。AtomoVideo通过融合多粒度图片注入和时间建模技术,使用预训练的Stable Diffusion 1.5和CLIP编码器,提高视频与原始图片的一致性。
英伟达推出了生成式AI(AIGC)专业认证,旨在通过考试提供行业认可的权威证书,并提供相应的培训课程。认证内容涵盖生成式AI和大语言模型知识,考试为远程方式,适合多种AI相关职业人士。
OpenAI官网公布了马斯克与联合创始人的邮件,揭示马斯克对OpenAI的控制欲和与特斯拉合并的想法。马斯克认为OpenAI需要每年数十亿美元才能与谷歌竞争,但最终因对控制权的分歧离开了OpenAI。
谷歌DeepMind推出Genie,一个无需数据标记、无监督训练的生成交互模型,具有110亿参数,能基于图像、照片或草图生成可控制动作的视频游戏。Genie通过大规模训练,学习潜在动作关系,可应用于其他领域。