智能AI是去年生成式AI领域的重大突破技术,今年企业将大规模部署这些系统。但整合智能AI与现有系统存在诸多挑战,包括基础设施现代化、数据集成、安全合规等。IT领导者需要谨慎考虑这些问题,以确保成功部署智能AI系统。
ElevenLabs是一家刚刚完成1.8亿美元融资的人工智能初创公司,主要以其音频生成能力而闻名。该公司通过推出首个独立的语音转文本模型Scribe,迈出了另一个技术方向。该初创公司估值为33亿美元,已帮助许多其他公司提供语音转文本服务,利用其庞大的声音库。然而,该公司现在希望进入语音检测领域,与Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型竞争。
随着人工智能、物联网和边缘计算的进步,数据创建的扩展正在重塑数据中心的存储管理方式。虽然固态硬盘(SSD)在速度讨论中占主导地位,但成本效益的可扩展性仍依赖于创新的硬盘驱动器(HDD)技术。对于寻求增强存储需求的组织,叠瓦式磁记录(SMR)可以在与传统磁记录(CMR)HDD相比,提供高达20%的额外存储容量,且几乎没有额外成本。随着超大规模数据中心的采用加速,SMR可以帮助实现可持续性和存储经济学的必要基准。
数据存储与韧性公司孤星(Lonestar)与半导体和存储公司Phison于周三在SpaceX火箭上发射了一项数据中心基础设施,目标是月球。
亚马逊网络服务公司今天发布了其首款量子计算芯片,称其代表了第一代实现优越错误纠正的硬件,这一障碍使得技术的扩展变得困难。Ocelot作为新处理器的名称,与当前方法相比,实施量子错误纠正的成本降低了多达90%。AWS使用了一种从头开始构建的专用架构,采用了所谓的“猫量子比特”。亚马逊研究人员在2021年首次提出了这一方法,并最近在《自然》杂志上发表了一篇描述该错误纠正技术的论文,该技术以著名的薛定谔猫思想实验命名。
OpenAI 推出代号"Orion"的 GPT-4.5 模型,这是公司迄今最大规模的 AI 模型。GPT-4.5 在计算能力和训练数据方面均超越以往版本,但 OpenAI 并不认为它是前沿模型。该模型将逐步向付费用户开放,但运营成本高昂。尽管在某些基准测试中表现出色,但 GPT-4.5 在部分任务上仍落后于其他 AI 推理模型,凸显了传统预训练方法的局限性。
雷军表示:时代大潮,浩浩荡荡,先进科技,滚滚而来,一个全新的时代已经开启,属于小米的新传奇正在展开。
Xiaomi 15 Ultra 不仅拥有令人叹为观止的光学影像实力,更集小米先锋科技之大成,是实至名归的小米高端化“答卷之作”。
Inception是一家位于帕洛阿尔托的新公司,由斯坦福大学计算机科学教授Stefano Ermon创立,声称开发了一种基于“扩散”技术的新型AI模型,称为扩散基础的大型语言模型(DLM)。目前备受关注的生成AI模型大致可分为两类:大型语言模型(LLMs)和扩散模型。Inception的模型结合了传统LLMs的功能,如代码生成和问答,但性能显著更快,计算成本更低。
亚马逊正在重塑其旗舰语音助手 Alexa,通过整合 AI 代理、模型混合和浏览器操作能力,打造更智能的 Alexa+。新版本不仅可以主动提供个性化信息,还能理解复杂指令并完成多步骤任务。亚马逊希望通过这种创新方式,让 Alexa 成为更强大、更智能的家庭语音助手。
亚马逊在周三分享了一个令人印象深刻的“代理”未来愿景——在这个未来中,改进后的 Alexa+ 将处理无数日常任务,从预订餐厅到寻找家电维修工。如果亚马逊能够实现这一目标,它可能会成为首个推出全面、以消费者为中心的代理工具的公司。该公司希望将更自然、更具表现力的 Alexa(由生成性 AI 模型驱动)与能够以完全自主、智能的方式接入第一方和第三方应用、服务及平台的能力结合起来。
微软推出了新一代高效 AI 模型 Phi-4,可同时处理文本、图像和语音,且计算资源需求大幅降低。其中 Phi-4-Multimodal 仅有 56 亿参数,Phi-4-Mini 仅有 38 亿参数,性能却超越同等规模竞品,甚至在某些任务上媲美两倍大小的模型。这一突破性进展为开发者提供了先进的 AI 能力,有望推动边缘计算和普及 AI 应用。
阿里云开源了其视频基础模型系列,为企业和研究人员提供视频创作能力。这包括两个版本的四个模型,分别拥有140亿和13亿参数。这些模型可以从文本和图像输入生成高质量视频,支持中英文文本效果,并在视频生成模型基准测试中表现出色。此举旨在降低AI应用门槛,让更多企业能够创建高质量视觉内容。
高通推出全新的"龙翼"(Dragonwing)品牌,专注于工业和嵌入式物联网、网络和蜂窝基础设施解决方案。这一举措旨在强化高通在消费者和工业领域的领导地位,并推动公司长期增长战略。龙翼品牌将提供边缘智能、高性能低功耗计算和连接技术,助力能源、零售、供应链、制造和电信等行业加速数字化转型,提升运营效率和竞争力。
亚马逊推出Alexa+订阅服务,大幅提升Alexa的对话和任务处理能力。它能理解日常用语,执行复杂指令,并整合多种第三方服务。Prime会员可免费使用,非会员每月需付20美元。这项服务旨在提升Alexa的盈利能力,但也引发了隐私和数据使用方面的担忧。
尽管风险投资市场依然紧张,但每个月仍有新的独角兽公司诞生。根据 Crunchbase 和 PitchBook 的数据,TechCrunch 跟踪了截至 1 月底新成立的风险投资支持的独角兽初创公司。这些公司包括医疗保健公司 Hippocratic AI 和卫星公司 Loft Orbital。此列表将在全年更新,敬请关注今年的强劲企业!
Akool推出了一项创新技术,将生成式AI模型与2D头像相结合,创造出栩栩如生的虚拟角色。用户只需上传照片和录音,即可定制个性化头像,实现与AI模型的自然交互。这项技术可广泛应用于电商、教育、医疗等领域,大幅提升用户体验和参与度。Akool的解决方案已为多家全球品牌节省了大量制作成本,加速了市场拓展。
高通和诺基亚贝尔实验室成功展示了多厂商AI模型在无线网络中的互操作性。通过序列学习技术,他们实现了编码器和解码器模型的无缝协作,提高了网络效率和用户体验。这项突破性成果为AI在无线通信领域的应用开辟了新的可能性,有望显著提升网络容量、可靠性和能源效率。
一家新创公司希望帮助开发者创建定制化的上下文编码助手,这些助手可以与任何模型连接,并与他们的开发环境无缝集成。Continue成立于2023年6月,由首席执行官Ty Dunn和首席技术官Nate Sesti创办,作为Y Combinator的校友,Continue在过去几年中已经在GitHub上获得了约23,000个星标,并在Discord社区中拥有11,000名成员。为了进一步发展,Continue宣布其产品的1.0版本,并获得了300万美元的种子资金支持。