激烈的“百模大战”伴随着科技同行对GPU算力的哄抢,大模型竞争的焦点竟不在大模型本身,而在算力。
第三届中国国际软件发展大会创新成果发布会在北京国家会议中心召开。作为中国国际软件发展大会的重要组成部分,本次发布会集中展示了网络安全、智能工厂、协同办公、数据库等多个领域的卓越成就和创新突破
商汤科技发布「日日新SenseNova 5.0」大模型,全面对标GPT-4,强调行业场景落地。新模型提升了自然语言处理、综合推理、代码生成和多模态交互能力。同时,推出企业级一体机,支持本地化部署,降低企业应用大模型门槛。商汤还展示了端云协同解决方案,提高了推理效率。与金山办公、华为、小米等伙伴探讨大模型在不同领域的应用。
据悉,Phi-3-mini是微软Phi家族的第4代,有预训练和指令微调多种模型,参数只有38亿训练数据却高达3.3T tokens,比很多数百亿参数的模型训练数据都要多,这也是其性能超强的主要原因之一。
然人工智能一直是元宇宙发展的基石,但 生成式人工智(GenAI) 更进一步。这对企业和投资者来说都是一个至关重要的变化。例如,游戏公司可以设计越来越复杂和现实的游戏和世界,从而扩大他们对消费者的吸引力并产生新的收入
Meta发布开源大模型Llama-3,具有80亿和700亿参数版本,性能在推理、数学、代码生成等方面有显著提升。Llama-3采用了分组查询注意力、掩码等技术,提高了计算效率。预训练数据达15T tokens,支持多语言。测试显示Llama-3性能超过多个知名模型。
Coveware吸引Veeam的产品之一是Recon,该产品可以查看现有环境中的漏洞。
在“震惊世人”的Sora出现后,行业内外对于多模态大模型的讨论也愈发激烈,但也有一种声音表示Sora并不能“理解”物理世界。生成的内容经常出现“穿模”的现象,即图像或场景中物体的相互穿透,以及不符合现实物理属性的动作等问题。
《城市数字化发展指数(2024)》突破性融入AIGC技术应用,基于新华三百业灵犀LinSeer私域大模型,结合各城市的基础数据,实现智能语音交互,为城市管理者在线生成定制化的城市专属报告,全面开启AI时代城市数字化发展研究新范式。
在Create 2024百度AI开发者大会上,李彦宏宣布推出三款AI开发工具:AgentBuilder、AppBuilder、ModelBuilder,并强调自然语言将成为新的编程语言。文心大模型用户数突破2亿,百度在AI原生应用开发方面提出MoE、小模型和智能体三大思路。
文心一言发布一年用户数突破2亿,API日均调用量超过两亿,服务用户数达到8.5万,千帆平台开发的AI原生应用超过19万。
在人工智能领域,大模型因其在理解和生成自然语言方面的卓越能力而备受关注。通过捕捉和再现人类语言的复杂性和微妙性,为使用者提供了与机器进行自然对话的可能性。
联想AI PC个人智能体即将于4月18日联想创新科技大会(2024 Lenovo Tech World)上正式亮相。
4月9日,首届百度智能云2024GENERATE全球生态大会召开,百度智能云这一次用小支点,翘起合作伙伴,形成大世界的跃迁。
弱智吧的数据真的这么厉害吗?持着好奇和怀疑的态度,我们仔细阅读了这篇论文,「弱智吧的数据碾压其他数据」这个结论有待深入讨论和探索。我们提出以下几个疑问:
文本到图像生成领域最近随着扩散模型的引入取得了显著进步。然而,对不 一致问题仍然缺乏合理的解释。缓解文本提示和图像之间的不对齐仍然是一个挑战。
宁畅总裁秦晓宁表示,大模型狂欢的背后是对整个AI支撑能力加速迭代的提升。基于此,宁畅发布“全局智算”战略,并揭幕了包括“AI算力栈”在内的一系列战略性新品与系统解决方案,旨在有效解决大模型产业落地的全周期问题。
近日,《纽约时报》报道, OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。
在大模型领域英语一直是训练数据最重要的语言,但由于中英文的结构和文化差异,直接将英文数据集翻译成中文并不理想。所以,为了填补高质量中文数据集的空白,研究人员开发出了COIG-CQIA数据集。