最新文章第2页

AI搜索引擎

RAG技术

智能答题

2024-06-28

ThinkAny：新时代 AI 搜索引擎

ThinkAny是一款新时代AI搜索引擎，它采用RAG技术来检索和聚合优质内容，并结合AI智能答题功能，以高效率解答用户提出的问题。

大模型

图像

文本

2024-05-21

MiniCPM-Llama3-V 2.5实现了GPT-4V级的多模态能力

MiniCPM-Llama3-V 2.5：MiniCPM-V系列的最新、性能最佳模型。

llm-answer-engine

回答引擎

搜索引擎

2024-04-07

llm-answer-engine：一个Perplexity风格的回答引擎项目

llm-answer-engine是一个使用Next.js、Groq、Mixtral、Langchain、OpenAI、Brave和Serper构建的Perplexity风格的回答引擎项目。

AI

大模型

开源

2024-03-19

马斯克开源Grok-1

Grok-1的参数量达到了3140亿，这使其成为迄今为止参数量最大的开源大语言模型。

交互体验

生产力工具

AI应用

2024-03-18

AI应用：从生产力工具到交互体验升级

文章讨论了AI应用从提升生产力工具到改善交互体验的发展。

想象力

创意写作

场景描述

2024-03-14

Sora中文提示词整理：文本到视频

这篇文章是一系列创意写作提示的集合，每个提示描述了一个独特的场景或概念，旨在激发想象力和创作灵感。

OpenAI

Transformer Debugger

语言模型

可解释性技术

2024-03-13

OpenAI开源Transformer Debugger (TDB)

OpenAI的超级对齐团队开发了Transformer Debugger（TDB），这是一个旨在支持对小型语言模型特定行为进行调查的工具，它结合了自动化的可解释性技术与稀疏自编码器。

开源

DeepSeekVL

多模态模型

训练策略

2024-03-12

DeepSeek-VL：深度求索的多模态大模型

DeepSeekVL是一款开源多模态模型，通过对训练数据、模型架构和训练策略的联合拓展，构建了7B与1.3B规模的强大模型。相关资源可通过论文链接、模型下载页面和GitHub主页获取。

2024-03-11

Anthropic进展追踪-超越GPT-4的表现，Claude3有多强

文章讨论了Anthropic公司的AI模型Claude3，该模型在性能上超越了GPT-4。文中未提及具体技术细节或关键词，因此无法提取相关关键词或进行内容精简。

深度学习推理框架

现代C++编程

计算图

算子优化

2024-03-07

KuiperInfer：自制深度学习推理框架

本项目教你从零开始打造深度学习推理框架，涵盖深度学习背后知识、现代C++编程、计算图设计、算子实现及优化。完成后，你将拥有能推理多种模型的个人推理框架，有助于面试和知识提升。

视频生成模型

Open-Sora Plan

可变分辨率

可变时长

2024-03-05

Open-Sora Plan项目：旨在重现 OpenAI 的视频生成模型Sora

北大和Rabbitpre AI发起的Open-Sora Plan项目致力于复现OpenAI的视频生成模型Sora。项目包括Video VQ-VAE压缩视频至潜在维度，Denoising Diffusion Transformer去噪，以及Condition Encoder支持多条件输入。特色在于支持可变长宽比、分辨率和时长，通过动态掩蔽策略、位置插值等技术实现高效训练和生成不同规格的视频。

大型语言模型

开源

ChatMusician

音乐生成

2024-03-04

音乐与大模型的研究

我们推出了ChatMusician，一个开源的大型语言模型（LLM），它通过在文本兼容的音乐表示上进行预训练和微调，能够理解和生成音乐。

NLP工程化

专注于Python/C++/CUDA、ML/DL/RL和NLP/KG/DS/LLM领域的技术分享。

杨晓东眼中的AI"中国速度"，希捷如何跑赢这场数据竞赛？

当ERP长出AI神经，胜负手在于业务扎根

CES 2025：沉浸AI

大模型落地，你还缺怎样的“工具箱”？

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: