这个模型一般的GPU肯定是跑不起来,如此大的参数在部署方面个人开发者也负担不起(如果你有一些H100也没问题),估计是给企业、政务公共部门用的。对于Meta即将发布的模型,就有网友泼冷水。相比OpenAI最新的GPT-4o mini版本,Llama 3.1-70B推理成本提升了3倍,但编码的性能却要差很多。
Numina一路披荆斩棘、过关斩将,在50道超难的数学竞赛题中,其AI模型回答对了29道比第二名多出7道顺利拿下第一名。
中国凭借庞大的“原生数字人口”以及健康、积极的创新技术生态,在生成式AI产品场景化落地和应用方面领先美国、英国、日本等发达国家。
球申请生成式AI专利前10位分别是:腾讯、平安保险、百度、中国科学院、IBM、阿里巴巴、三星电子、Alphabet(谷歌母公司)、字节跳动和微软。(排名按照专利数量)
Gen-3 Alpha是Runway在本月17日最新推出的产品,与上一代相比,光影、质量、构图、文本语义还原、物理模拟、动作一致性/连贯性等方面实现大幅度提升,剑指OpenAI的Sora。
全球著名开源平台huggingface的联合创始人宣布,阿里开源的Qwen2-72B指令微调版本成为开源模型排行榜第一名。使用300块H100对全球100多个主流开源大模型进行评估,结果显示,Qwen-2 72B力压其他模型,中国在全球开源大模型领域处于领导地位。StabilityAI的研究总监Tanishq认为,中国在开源大模型领域非常有竞争力,期待阿里发布更多高性能的开源大模型。
与以往模型不同的是,CriticGPT是一款面向开发人员的产品,可以增强RLHF(人类反馈强化学习)的效率培育出质量更好的训练数据。
OpenAI在官网宣布,美国陆军退役四星上将、前美国网络司令部司令、前国家安全局局长、前中央安全局局长,Paul M. Nakasone(中曾根)加入董事会和安全委员会。
41%的人正通过生成式AI获取旅行灵感或行程规划,这一比2023年8月的34%提升了7%,并且82%使用过的生成式AI用户会再次通过它来进行旅游方面的应用。
Imagen3在理解文本提示方面比前两代更好,可捕捉长文本提示中的很多细微细节,对图片的嵌入文字生成也更加准确、稳定。
微软发布了Copilot+ PC,这是全球首个专为AI设计的Windows PC,也是Windows史上最强版本。
Veo支持文本生成超过1分钟的1080P超高清视频,在文本语义还原、视频动作一致性方面、运镜、帧与帧之间的连贯性、场景切换、光影效果等,可媲美OpenAI的Sora。
根据OpenAI最新的SSL证书日志显示,已经创建了search.chatgpt.com子域名(目前无法访问),将会进军搜索引擎全面挑战该领域的全球霸主谷歌。
OpenAI首席执行官Sam Altman在社交平台提及GPT-2模型,引发猜测是否为即将发布的新模型。Altman否认了这些猜测,但GPT-2的性能表现令人关注。OpenAI可能正在开发适用于移动设备的高性能、低消耗模型,以应对硬件限制和提高推理效率。这种模型可能会被用于苹果iOS 18中,以增强用户体验。
OpenAI联合创始人Sam Altman在斯坦福大学演讲,强调AI技术未达极限,OpenAI致力于实现AGI。Altman认为开源非实现AGI最佳途径,需商业回报以资助创新。OpenAI领先生成式AI领域,发布影响力巨大的产品如Sora,同时免费提供ChatGPT以造福人类。Altman还回忆了与英伟达的合作历史,展望双方友谊。
据悉,Phi-3-mini是微软Phi家族的第4代,有预训练和指令微调多种模型,参数只有38亿训练数据却高达3.3T tokens,比很多数百亿参数的模型训练数据都要多,这也是其性能超强的主要原因之一。
Meta发布开源大模型Llama-3,具有80亿和700亿参数版本,性能在推理、数学、代码生成等方面有显著提升。Llama-3采用了分组查询注意力、掩码等技术,提高了计算效率。预训练数据达15T tokens,支持多语言。测试显示Llama-3性能超过多个知名模型。
马斯克旗下AI公司x.ai推出Grok-1.5 Vision,具备视觉功能,能深度理解真实世界并进行数据解读、转换。Grok-1.5 V在多模态模型测试中超过GPT-4V等竞品,展示了强大的理解、数据转换和检索能力,如将图片翻译成Python代码。即将向早期测试者和现有用户推出。
4月7日,CNN消息,美国伊萨卡学院-战略传播学教授Diane Gayeski,正在使用ChatGPT批改学生的论文。