最新文章
剪映要变天了?字节Vidi2自动根据素材剪辑视频
2025-12-04

剪映要变天了?字节Vidi2自动根据素材剪辑视频

剪映要变天了?字节Vidi2自动根据素材剪辑视频

突破性AI助手:Skywork-R1V4让机器像侦探一样“看图说话“还能上网搜证据

突破性AI助手:Skywork-R1V4让机器像侦探一样“看图说话“还能上网搜证据

昆仑万维Skywork AI团队开发的Skywork-R1V4是一款突破性的多模态AI助手,能够像侦探一样主动分析图像、上网搜索信息并将两种能力无缝结合。该系统仅通过3万个高质量样本的监督学习就实现了卓越性能,在多项测试中超越了更大规模的商业模型,证明了精妙设计比单纯扩大规模更重要,为AI助手的实用化发展指明了高效路径。

Myriota推出HyperPulse 5G非地面网络IoT连接服务

Myriota推出HyperPulse 5G非地面网络IoT连接服务

太空物联网连接服务商Myriota宣布其HyperPulse连接平台正式商用,该平台结合公司5G非地面网络架构与从Viasat租赁的L波段容量。该平台采用波束跳跃技术,根据流量需求激活所需波束,优化电池供电物联网设备功耗。相比UltraLite服务,HyperPulse提供更低延迟和更高日数据传输量。服务将于12月15日在美国、墨西哥、巴西、澳大利亚和沙特正式上线。

香港科大最新突破:让AI看图像重建3D世界的速度飞起来了

香港科大最新突破:让AI看图像重建3D世界的速度飞起来了

香港科技大学研究团队开发出FlashVGGT技术,通过创新的"压缩代表"策略和分块递归推理机制,将3D重建速度提升10倍以上,能处理超过3000张图像的超长序列。该技术在保持重建质量的同时显著降低计算复杂度,为VR游戏、建筑测量、自动驾驶等领域提供更实用的3D重建解决方案。

HPE与AMD扩大合作推进开放式机架级AI基础设施

HPE与AMD扩大合作推进开放式机架级AI基础设施

AMD与HPE宣布扩大合作,共同开发下一代开放式可扩展人工智能基础设施。HPE将成为首批采用AMD Helios机架规模AI架构的系统供应商,该架构整合了AMD EPYC处理器、Instinct GPU、Pensando网络技术和ROCm开源软件栈。Helios平台每机架可提供2.9 exaFLOPS的FP4性能,采用开放机架宽设计标准,旨在简化大规模AI集群部署。HPE计划2026年全球推出该解决方案。

Tel Aviv大学团队破解视频编辑难题:让人像视频编辑既精准又自然

Tel Aviv大学团队破解视频编辑难题:让人像视频编辑既精准又自然

Tel Aviv大学研究团队开发了Sync-LoRA技术,专门解决人像视频编辑中的同步难题。该技术能在保持原视频动作完美同步的前提下,实现高质量的外观编辑。通过分析说话、眼神、眨眼和姿势四个维度,确保编辑后视频与原视频逐帧对应。这项技术为个性化视频内容创作和影视后期制作提供了新的可能。

爱立信与LotusFlare合作加速网络API技术普及

爱立信与LotusFlare合作加速网络API技术普及

爱立信宣布与软件开发公司LotusFlare达成战略合作伙伴关系,旨在通过API技术为企业和开发者创造创新应用机会。爱立信收购了LotusFlare的少数股权,其Vonage部门将利用加速的API供应来推动新网络功能的使用。LotusFlare的DNO Cloud平台提供同意管理和数字商务解决方案,通过网络API实现先进网络功能的曝光和货币化。

NVIDIA推出PixelDiT:让AI直接在原图上作画,告别“压缩失真“时代

NVIDIA推出PixelDiT:让AI直接在原图上作画,告别“压缩失真“时代

NVIDIA联合罗切斯特大学提出PixelDiT,首次实现直接在原始像素空间进行高质量图像生成,突破传统"压缩-生成-解压"模式的信息损失问题。该系统采用双层transformer架构,通过"构图大师"和"细节专家"分工协作,在ImageNet上达到1.61 FID分数,显著超越现有像素生成模型。更重要的是,PixelDiT实现了"无损图像编辑",避免了传统方法中自编码器造成的细节失真,为精确图像处理应用开辟新路径。

构建MCP服务器简单,但让它正常运行却困难重重

构建MCP服务器简单,但让它正常运行却困难重重

模型上下文协议(MCP)构建简单,但在生产环境中成功运用需要更多努力。MCP虽然能快速连接大语言模型与数据库,但这种速度实际上是一种风险。企业面临五大挑战:安全风险、工具过载、扩展性限制、测试与生产环境差距以及治理合规问题。专家建议采用身份控制、限制工具访问、加强协调机制、缩小代理任务范围和构建安全护栏等解决方案。

英伟达推出8B参数的小模型管家:让AI工具协同工作比单打独斗更聪明

英伟达推出8B参数的小模型管家:让AI工具协同工作比单打独斗更聪明

英伟达团队开发了ToolOrchestra系统,核心是80亿参数的Orchestrator模型,它像AI工具管家一样协调各种专业AI工具协同工作。该系统通过强化学习平衡准确性、成本和用户偏好,在HLE测试中以37.1%成绩超越GPT-5的35.1%,成本仅为后者40%。研究证明小模型智能协调比大模型单打独斗更高效经济。

Linux 6.18发布:年度最后版本或成新长期支持版本

Linux 6.18发布:年度最后版本或成新长期支持版本

Linux 6.18内核作为2025年最后一个版本正式发布,预计将成为下一个长期支持版本。此版本移除了实验性的bcachefs文件系统,大幅提升了多种文件系统性能,包括XFS支持在线检修、exFAT驱动速度提升16倍等。新增对华硕、联想等品牌手持设备的支持,改进了Nvidia GPU开源驱动,新增Rust版本的Android Binder组件,并引入新的存储管理机制。

卡尔斯鲁厄理工学院发布BOOM:让全球学生都能用母语上课的神奇系统

卡尔斯鲁厄理工学院发布BOOM:让全球学生都能用母语上课的神奇系统

这项由卡尔斯鲁厄理工学院开发的BOOM系统实现了首个真正的多模态多语言讲座翻译,能够同时处理音频和幻灯片图像,产生同步的文本、本地化幻灯片和语音输出。系统通过视觉上下文显著提升了翻译质量,特别在技术术语理解方面,并展示了对后续摘要和问答任务的积极影响,为全球教育资源共享开辟了新路径。

邮件订阅