最新文章
吴恩达(Andrew Ng)的新书《How to Build Your Career in AI》
2024-10-30

吴恩达(Andrew Ng)的新书《How to Build Your Career in AI》

这本书最大的价值在于提供了全方位的AI职业发展建议,包括: 如何掌握核心AI技能 求职面试技巧 如何打造个人项目作品集 如何建立和利用人脉网络 如何克服冒充者综合症

本地交互式知识图谱构建工具:Local Knowledge Graph

本地交互式知识图谱构建工具:Local Knowledge Graph

Local Knowledge Graph从本地数据源构建知识图谱,并提供可视化和分析功能。提供交互式 Web 界面,展示推理过程,并将推理步骤以动态知识图谱的形式可视化,基于语义相似性提供问题回答。

AutoGen Studio的开源界面:微软的AI应用开发平台AutoGen
2024-09-06

AutoGen Studio的开源界面:微软的AI应用开发平台AutoGen

微软推出了一个名为AutoGen Studio的开源界面。该界面可以通过设置Python API,以及简单的拖拽页面操作,从而无需编写代码,即可快速构建、测试、定制和共享AI智能体,极大简化了AI应用的开发。

第一个开源的具有实时对话能力的多模态模型:Mini-Omni

第一个开源的具有实时对话能力的多模态模型:Mini-Omni

Mini-Omni是清华大学启元实验室开源的多模态模型,具备实时语音到语音的对话能力,无需额外的ASR或TTS模型。它能够边思考边说话,支持流式音频输出,并能通过'Any Model Can Talk'方法为其他模型添加语音交互能力。

Qwen2-VL:阿里巴巴云计算团队开发的多模态大型语言模型系列

Qwen2-VL:阿里巴巴云计算团队开发的多模态大型语言模型系列

Qwen2-VL:阿里巴巴云计算团队开发的多模态大型语言模型系列,具备处理各种分辨率和比例的图像、理解超过20分钟视频、操作移动设备和机器人、以及支持多语言文本理解等多项先进功能。

Qwen2-Audio:多模态AI系统,融合语音对话和音频分析功能

Qwen2-Audio:多模态AI系统,融合语音对话和音频分析功能

多模态AI系统,融合语音对话和音频分析功能,支持超过8种语言和方言,无需自动语音识别即可进行语音交互,提供音频信息分析和多语言支持。

GraphRAG-Local-UI:使用本地 LLM 的 GraphRAG

GraphRAG-Local-UI:使用本地 LLM 的 GraphRAG

使用本地 LLM 的 GraphRAG - 具有强大的 API 和用于索引/快速调整/查询/聊天/可视化/等的多个应用程序。

开源框架Ollama支持访问外部工具

开源框架Ollama支持访问外部工具

在Ollama的v0.3版本中,LLM可以访问各种工具,比如search API、网页浏览、代码解释器、计算器等外部功能。

由LLM驱动的自主Agent集合

由LLM驱动的自主Agent集合

由LLM驱动的自主Agent集合,涵盖任务解决、多智能体协作、社会模拟等项目,提供框架、基准评估和相关资源,推动AI代理技术的发展。

Dify中HTTP请求节点的常见操作
2024-07-30

Dify中HTTP请求节点的常见操作

Dify 在 HTTP 请求中的流程编写

搞了半天原来GPT-4o-mini是基于GPT-3.5架构的模型(Dify中接入GPT-4o mini模型)

搞了半天原来GPT-4o-mini是基于GPT-3.5架构的模型(Dify中接入GPT-4o mini模型)

GPT-4o mini("o"代表"omni")是小型型号类别中最先进的型号,也是OpenAI迄今为止最便宜的型号。它是多模态的(接受文本或图像输入并输出文本),具有比 gpt-3.5-turbo 更高的智能,但速度同样快。它旨在用于较小的任务,包括视觉任务。

Mem0:个性化AI的智能记忆层

Mem0:个性化AI的智能记忆层

多层次记忆:Mem0支持用户级、会话级和AI代理级的记忆保留,确保信息在不同层面得到适当的存储和利用。 自适应个性化:系统能够根据与用户的交互不断改进,提供越来越精准的个性化体验。

GraphRAG本地化与Ollama集成及交互式UI:结合知识图谱的本地模型支持和交互界面

GraphRAG本地化与Ollama集成及交互式UI:结合知识图谱的本地模型支持和交互界面

结合知识图谱的本地模型支持和交互界面,提供低成本、高效能的知识管理和查询工具,适用于数据管理、查询执行和结果可视化。

Dify中的经济索引模式实现过程

Dify中的经济索引模式实现过程

如何使用离线的向量引擎、关键词索引等方式,降低了准确度但无需花费 Token

书生·浦语基于InternLM2模型迭代出了InternLM2.5系统

书生·浦语基于InternLM2模型迭代出了InternLM2.5系统

书生·浦语基于InternLM2模型与上一代 InternLM2 相比,推理性能提高了20%。数学推理性能超过了Llama3、Gemma2-9B等

ThinkAny:新时代 AI 搜索引擎

ThinkAny:新时代 AI 搜索引擎

ThinkAny是一款新时代AI搜索引擎,它采用RAG技术来检索和聚合优质内容,并结合AI智能答题功能,以高效率解答用户提出的问题。

MiniCPM-Llama3-V 2.5实现了GPT-4V级的多模态能力

MiniCPM-Llama3-V 2.5实现了GPT-4V级的多模态能力

MiniCPM-Llama3-V 2.5:MiniCPM-V系列的最新、性能最佳模型。

llm-answer-engine:一个Perplexity风格的回答引擎项目

llm-answer-engine:一个Perplexity风格的回答引擎项目

llm-answer-engine是一个使用Next.js、Groq、Mixtral、Langchain、OpenAI、Brave和Serper构建的Perplexity风格的回答引擎项目。

马斯克开源Grok-1

马斯克开源Grok-1

Grok-1的参数量达到了3140亿,这使其成为迄今为止参数量最大的开源大语言模型。

AI应用:从生产力工具到交互体验升级

AI应用:从生产力工具到交互体验升级

文章讨论了AI应用从提升生产力工具到改善交互体验的发展。