最新文章
谷歌发布文生图模型Imagen 3,写实效果超强!

谷歌发布文生图模型Imagen 3,写实效果超强!

Imagen3在理解文本提示方面比前两代更好,可捕捉长文本提示中的很多细微细节,对图片的嵌入文字生成也更加准确、稳定。

微软发布Copilot+ PC:集成GPT-4o,史上最强、最快Windows!

微软发布Copilot+ PC:集成GPT-4o,史上最强、最快Windows!

微软发布了Copilot+ PC,这是全球首个专为AI设计的Windows PC,也是Windows史上最强版本。

谷歌发布Veo:文生超1分钟、1080P视频,媲美Sora
2024-05-16

谷歌发布Veo:文生超1分钟、1080P视频,媲美Sora

Veo支持文本生成超过1分钟的1080P超高清视频,在文本语义还原、视频动作一致性方面、运镜、帧与帧之间的连贯性、场景切换、光影效果等,可媲美OpenAI的Sora。

OpenAI下周将发布ChatGPT搜索引擎,挑战谷歌搜索!

OpenAI下周将发布ChatGPT搜索引擎,挑战谷歌搜索!

根据OpenAI最新的SSL证书日志显示,已经创建了search.chatgpt.com子域名(目前无法访问),将会进军搜索引擎全面挑战该领域的全球霸主谷歌。

OpenAI神秘模型,再次被Sam Altman提及

OpenAI神秘模型,再次被Sam Altman提及

OpenAI首席执行官Sam Altman在社交平台提及GPT-2模型,引发猜测是否为即将发布的新模型。Altman否认了这些猜测,但GPT-2的性能表现令人关注。OpenAI可能正在开发适用于移动设备的高性能、低消耗模型,以应对硬件限制和提高推理效率。这种模型可能会被用于苹果iOS 18中,以增强用户体验。

Sam Altman:GPT-5,将会比现在的大模型更智能

Sam Altman:GPT-5,将会比现在的大模型更智能

OpenAI联合创始人Sam Altman在斯坦福大学演讲,强调AI技术未达极限,OpenAI致力于实现AGI。Altman认为开源非实现AGI最佳途径,需商业回报以资助创新。OpenAI领先生成式AI领域,发布影响力巨大的产品如Sora,同时免费提供ChatGPT以造福人类。Altman还回忆了与英伟达的合作历史,展望双方友谊。

微软开源最强小参数大模型—Phi-3 Mini

微软开源最强小参数大模型—Phi-3 Mini

据悉,Phi-3-mini是微软Phi家族的第4代,有预训练和指令微调多种模型,参数只有38亿训练数据却高达3.3T tokens,比很多数百亿参数的模型训练数据都要多,这也是其性能超强的主要原因之一。

重磅!Llama-3,最强开源大模型正式发布!

重磅!Llama-3,最强开源大模型正式发布!

Meta发布开源大模型Llama-3,具有80亿和700亿参数版本,性能在推理、数学、代码生成等方面有显著提升。Llama-3采用了分组查询注意力、掩码等技术,提高了计算效率。预训练数据达15T tokens,支持多语言。测试显示Llama-3性能超过多个知名模型。

马斯克展示Grok-1.5 Vision:多模态,能理解真实世界

马斯克展示Grok-1.5 Vision:多模态,能理解真实世界

马斯克旗下AI公司x.ai推出Grok-1.5 Vision,具备视觉功能,能深度理解真实世界并进行数据解读、转换。Grok-1.5 V在多模态模型测试中超过GPT-4V等竞品,展示了强大的理解、数据转换和检索能力,如将图片翻译成Python代码。即将向早期测试者和现有用户推出。

有大学老师正用ChatGPT批改论文,让同学也这么做!

有大学老师正用ChatGPT批改论文,让同学也这么做!

4月7日,CNN消息,美国伊萨卡学院-战略传播学教授Diane Gayeski,正在使用ChatGPT批改学生的论文。

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI在官网宣布新增6个全新微调API功能,以扩展自定义模型,帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。

Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数
2024-04-07

Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数

据悉,Command R+有1040亿参数,支持英语、中文、法语、德语等10种语言。最大特色之一是,Command R+对内置的RAG(检索增强生成)进行了全面强化,其性能仅次于GPT-4 tubro,高于市面上多数开源模型。

“弱智贴吧”的数据,居然是最强中文语料库

“弱智贴吧”的数据,居然是最强中文语料库

在大模型领域英语一直是训练数据最重要的语言,但由于中英文的结构和文化差异,直接将英文数据集翻译成中文并不理想。所以,为了填补高质量中文数据集的空白,研究人员开发出了COIG-CQIA数据集。

Sora并非完美,致命缺点也很多

Sora并非完美,致命缺点也很多

华尔街日报科技专栏作家Joanna Stern专访OpenAI首席技术官Mira Murati,讨论全球爆火的文生视频模型Sora。访谈中,Mira回应了Sora的缺点、训练数据来源、上市时间以及生成内容的安全性等问题。Sora存在诸如理解提示文本不准确、物体控制不稳定等问题,且算力需求巨大,短期内不会上市。Sora的训练数据来自Shutterstock,未来可能推出视频修复功能。

AGI万字长文(上) | 2023回顾与反思

AGI万字长文(上) | 2023回顾与反思

2023年大众对AI的看法从怀疑到认可,AGI(通用人工智能)的发展迅速,大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽,创业者面临官方技术迭代的挑战。

Llama-3公布基础训练设施,使用49,000个H100

Llama-3公布基础训练设施,使用49,000个H100

Meta宣布了两个新的24K H100 GPU集群,用于训练大模型Llama-3,预计4月末或5月中旬上线。集群使用RoCEv2网络和基于Tectonic/Hammerspace的存储解决方案,支持PyTorch。

马斯克将在本周,开源类ChatGPT产品Grok

马斯克将在本周,开源类ChatGPT产品Grok

马斯克宣布将开源其公司xAI发布的生成式AI产品Grok,一款类ChatGPT产品,提供文本、代码生成等功能,性能超GPT-3.5但弱于GPT-4。Grok-1在多个测试平台表现优异,但仍有局限性,如需内容审核,无独立搜索能力。

文本+图片生成高保真视频,阿里推出视频模型AtomoVideo

文本+图片生成高保真视频,阿里推出视频模型AtomoVideo

阿里巴巴技术团队推出AtomoVideo,一种文本+图片生成高保真视频的模型。AtomoVideo通过融合多粒度图片注入和时间建模技术,使用预训练的Stable Diffusion 1.5和CLIP编码器,提高视频与原始图片的一致性。

英伟达推出”生成式AI专业认证“,帮你成为大模型开发专家!

英伟达推出”生成式AI专业认证“,帮你成为大模型开发专家!

英伟达推出了生成式AI(AIGC)专业认证,旨在通过考试提供行业认可的权威证书,并提供相应的培训课程。认证内容涵盖生成式AI和大语言模型知识,考试为远程方式,适合多种AI相关职业人士。

OpenAI公布2015—2018年重要邮件,回应马斯克起诉

OpenAI公布2015—2018年重要邮件,回应马斯克起诉

OpenAI官网公布了马斯克与联合创始人的邮件,揭示马斯克对OpenAI的控制欲和与特斯拉合并的想法。马斯克认为OpenAI需要每年数十亿美元才能与谷歌竞争,但最终因对控制权的分歧离开了OpenAI。