大模型 关键字列表
终端侧AI,如何从DeepSeek的连锁反应中受益?

终端侧AI,如何从DeepSeek的连锁反应中受益?

或许AI的下一波创新,不仅是比拼谁的模型更大,还要看谁能让AI更轻便、更普及、更贴近生活。

人工智能领域再添中国力量,阶跃星辰联合吉利贡献开源大模型

人工智能领域再添中国力量,阶跃星辰联合吉利贡献开源大模型

阶跃星辰与吉利联合开源两款,打造开源大模型世界的中国新势力。

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

结合英特尔Optimum-Habana 框架的优化,英特尔(R) Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率,仅需约10秒即可生成16张高质量的图片,性能表现卓越。

书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

上海人工智能实验室对书生大模型进行重要版本升级,书生·浦语3.0(InternLM3)通过精炼数据框架,大幅提升了数据效率,并实现思维密度的跃升。仅使用4T训练数据的InternLM3-8B-Instruct,其综合性能超过了同量级开源模型,节约训练成本75%以上;同时,书生·浦语3.0首次在通用模型中实现了常规对话与深度思考能力融合,可应对更多真实使用场景。

刚刚上线的Vidu2.0,想让所有人都用得起AI视频。

刚刚上线的Vidu2.0,想让所有人都用得起AI视频。

AI视频领域真的卷麻了,比2023年的大模型还卷。自从可灵1.6发了之后,明显感觉所有家都坐不住了,基本都把自己的牛逼货加速推了出来。整体看了一下Vidu2.0的效果,在模型质量上,比较惊艳,能跻身T1梯队。

夸克登顶中国AI应用活跃用户总榜,一站式AI服务打造强大产品力

夸克登顶中国AI应用活跃用户总榜,一站式AI服务打造强大产品力

夸克的年轻用户(24岁以下)占比超过50%,远高于行业平均水平。

大模型之家2024年12月热力榜:AI技术深耕产业应用,未来竞争格局初显端倪

大模型之家2024年12月热力榜:AI技术深耕产业应用,未来竞争格局初显端倪

Scaling Law在这一新阶段被赋予了新的定义,标志着大模型领域的竞争焦点已由单纯的基础模型能力比拼,拓展至对场景应用与商业变现能力的深度挖掘。在此转型过程中,人工智能在产业应用方面展现出的巨大价值愈发凸显。

突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

目前,Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法,通过比较查询键与两个较小集合中的键,可以快速找到最相关的键,而无需遍历模型的整个记忆层。

尽管AI军备竞赛激烈,但多模型共存的未来已成定局
2025-01-03

尽管AI军备竞赛激烈,但多模型共存的未来已成定局

AI无疑是人类最伟大的发明之一,我们坚信它的未来将是、也应该是多种模型共存的局面。

2024的最后一天,由智谱AI新上线的o1为这一年划上句点。

2024的最后一天,由智谱AI新上线的o1为这一年划上句点。

写一个python程序,主要功能是将普通视频转换为字符艺术视频。它首先将输入视频(jinitaimei.mp4)用ffmpeg按帧分解,然后把每一帧图像转换为由特定字符2、0、2、5和空格组成的字符画。转换过程中要将原图按比例缩放6倍,并将RGB颜色转换为灰度值并映射到对应字符。接着将这些字符画帧重新合成为视频,注意确保正确的帧顺序,生成一个字符艺术视频。

揭秘Scaling Law背后的“中国基因”:助推OpenAI成功的隐秘推手居然是它

揭秘Scaling Law背后的“中国基因”:助推OpenAI成功的隐秘推手居然是它

Scaling Law”,是指在深度学习中,增大数据量和模型参数能让模型性能指标提升,这种提升并非线性,而是遵循一种幂律关系。

百度这张AI成绩单,透出了2025年AI行业三大机会点

百度这张AI成绩单,透出了2025年AI行业三大机会点

百度发了一张2024年AI成绩单,涵盖百度在大模型、智能体、AI应用等领域的多项AI奖项。透过这份AI成绩单,我们或许能通过百度做AI的思路总结出一些布局AI的重点方向,找找明年做AI的机会。

国产开源之光:DeepSeek-V3划重点

国产开源之光:DeepSeek-V3划重点

DeepSeek-V3 采用了 671B 参数 MoE 架构,配备约 37B 激活单元,训练使用14.8T Token数据。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

当你来到这个世界睁开眼睛的第一刻,没有学会语言的时候,靠的就是你的眼睛。 我们先看到光影、颜色,才逐渐分辨出父母的面孔,屋子的空间,那时没有词汇、没有句子,只有模糊的光影与轮廓。

重磅!OpenAI开放满血o1模型API,成本暴降60%

重磅!OpenAI开放满血o1模型API,成本暴降60%

偏好微调特别适合那些对回答格式、语气或者抽象特质(如友好度、创造力)有较高要求的应用场合。例如,在构建金融咨询聊天机器人时,开发团队不仅希望模型能够提供专业且准确的财务建议,还期望它能保持友好和易于理解的沟通方式。

OpenAI提供大模型的提示缓存(Prompt Caching):GPT-4o系列模型输入价格下降一半,访问速度提升80%

OpenAI提供大模型的提示缓存(Prompt Caching):GPT-4o系列模型输入价格下降一半,访问速度提升80%

Azure OpenAI 的提示缓存功能为处理长提示和重复请求提供了一个非常有价值的优化方案。它通过减少计算延迟和成本,显著提高了模型的效率。

2024软件技术大会于12月13-14日在北京成功举办

2024软件技术大会于12月13-14日在北京成功举办

由中科软科技股份有限公司举办的年度技术盛会—“2024软件技术大会”于12月13-14日在北京朗丽兹西山花园酒店成功召开。本届大会以“数智软件 提升新质”为题,来自行业企业,软件公司的几百名软件技术爱好者参加了本次盛会。

微软发布主要使用合成数据训练的Phi-4语言模型

微软发布主要使用合成数据训练的Phi-4语言模型

微软开发出了一种小型语言模型,在解决某些数学问题时,它的效果比规模几倍于它的算法还要好。

年度SOTA性价比王者模型Nova横空出世,四大领域拉开技术代差

年度SOTA性价比王者模型Nova横空出世,四大领域拉开技术代差

新发布的Amazon Nova基础模型共包括四大模型:可用于简单任务的超高性价比文字处理Micro模型;三种多模态模型——低成本的Lite模型;兼具准确性、速度和成本的Pro模型;用于复杂的推理任务同时也可进行蒸馏定制的Premier模型。