最新文章
Sora中文提示词整理:文本到视频

Sora中文提示词整理:文本到视频

这篇文章是一系列创意写作提示的集合,每个提示描述了一个独特的场景或概念,旨在激发想象力和创作灵感。

OpenAI开源Transformer Debugger (TDB)

OpenAI开源Transformer Debugger (TDB)

OpenAI的超级对齐团队开发了Transformer Debugger(TDB),这是一个旨在支持对小型语言模型特定行为进行调查的工具,它结合了自动化的可解释性技术与稀疏自编码器。

DeepSeek-VL:深度求索的多模态大模型

DeepSeek-VL:深度求索的多模态大模型

DeepSeekVL是一款开源多模态模型,通过对训练数据、模型架构和训练策略的联合拓展,构建了7B与1.3B规模的强大模型。相关资源可通过论文链接、模型下载页面和GitHub主页获取。

Anthropic进展追踪-超越GPT-4的表现,Claude3有多强
2024-03-11

Anthropic进展追踪-超越GPT-4的表现,Claude3有多强

文章讨论了Anthropic公司的AI模型Claude3,该模型在性能上超越了GPT-4。文中未提及具体技术细节或关键词,因此无法提取相关关键词或进行内容精简。

KuiperInfer:自制深度学习推理框架

KuiperInfer:自制深度学习推理框架

本项目教你从零开始打造深度学习推理框架,涵盖深度学习背后知识、现代C++编程、计算图设计、算子实现及优化。完成后,你将拥有能推理多种模型的个人推理框架,有助于面试和知识提升。

Open-Sora Plan项目:旨在重现 OpenAI 的视频生成模型Sora

Open-Sora Plan项目:旨在重现 OpenAI 的视频生成模型Sora

北大和Rabbitpre AI发起的Open-Sora Plan项目致力于复现OpenAI的视频生成模型Sora。项目包括Video VQ-VAE压缩视频至潜在维度,Denoising Diffusion Transformer去噪,以及Condition Encoder支持多条件输入。特色在于支持可变长宽比、分辨率和时长,通过动态掩蔽策略、位置插值等技术实现高效训练和生成不同规格的视频。

音乐与大模型的研究

我们推出了ChatMusician,一个开源的大型语言模型(LLM),它通过在文本兼容的音乐表示上进行预训练和微调,能够理解和生成音乐。