最新文章
体验完百度世界2024上的iRAG,我觉得AI绘图也可以没有幻觉了。

体验完百度世界2024上的iRAG,我觉得AI绘图也可以没有幻觉了。

本质上,他是不是大模型按照自己的知识库回答,然后先通过一些工程化手段,比如联网搜索,比如文档搜索等等,先把相关信息给找出来,让大模型根据这些信息来进行回答。

智谱AI上线4K60帧"新清影",还要直接开源,我觉得他们疯了。

智谱AI上线4K60帧"新清影",还要直接开源,我觉得他们疯了。

现在智谱直接接力,直接开源了他们内部效果最好的AI视频模型。智谱的新清影,跟上一代比,已经进步巨大了。不管是审美、还是动作幅度、还是物理规律、还是稳定程度。

专访"Prompt之神"李继刚 - 我想用20年时间,给世界留一句话。

专访"Prompt之神"李继刚 - 我想用20年时间,给世界留一句话。

然后就他写着写着,Prompt就越写越长。因为他发现,原来是可以把思考结构给封装进去的,他之前读了大量的这种工具书,脑子里全是各种各样的方法论,随便掏一个,就能咣咣咣咣大量的写。

智谱AI的AutoGLM后,Google和微软也下场来做“贾维斯”了。

智谱AI的AutoGLM后,Google和微软也下场来做“贾维斯”了。

谷歌准备推出接管计算机的人工智能。上周三Claude、周五智谱AI、周末Google,然后微软。短短一周内,已经有四个公司爆出来要发布类似的产品了,其中三个已经悄悄发布产品:Anthropic的Claude,智谱的AutoGLM和微软的OmniParser。这些产品的能力有目共睹。

Runway的这个新功能,想要彻底颠覆动捕行业。

Runway的这个新功能,想要彻底颠覆动捕行业。

Runway发布了Act-One功能,允许用户上传视频以驱动角色模仿面部表情。传统动画和动捕相比,Act-One大幅降低了制作复杂度和成本,仅需上传视频和图片,短时间内即可生成视频。Act-One不仅稳定性高,还能适用于不同风格的角色,对动画行业具有革命性影响,为创作者提供了更多可能性。

我用AI 3D,终于实现了我的手办自由。
2024-10-28

我用AI 3D,终于实现了我的手办自由。

坦率的讲,要是两年前,我肯定得自己去徒手建模了。但是如今,让我自己再去建模那肯定不可能,C4D和Blender我打开都不想打开,作为一个AI博主,要是再回去手工建模,那简直就是就回到原始人了。

加强版Claude3.5正式上线,一句话操控电脑的时代真的要来了。

加强版Claude3.5正式上线,一句话操控电脑的时代真的要来了。

Claude 3.5 Sonnet和Haiku模型升级,引入新功能“计算机操控”。升级版Sonnet在性能上领先,具备编程能力和解决问题的实际能力。Haiku模型性价比高,击败大参数模型。新功能“计算机控制”允许模型执行在线任务,如浏览、点击和输入,模拟人与计算机互动。尽管目前功能仅对开发者开放,Anthropic相信模型将更好地融入日常生活,提升人机交互体验。

智谱AI悄悄发布AutoGLM,这一次,贾维斯真的要成现实了。

智谱AI悄悄发布AutoGLM,这一次,贾维斯真的要成现实了。

我直接放一个视频,你就可以,直观的体会一下他的强悍。比如,我对AutoGLM说:“我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。”

一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。

一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。

保持提示词简单直接:模型擅长理解和相应简单、清晰的指令,而不需要大量的指导。 当时我对这一条的理解,觉得是为了让o1模型更好的理解我的要求,同时可以加快模型的处理速度,因为模型不需要花费额外的时间去解析复杂的语句。

这两个AI,让你的国庆出行没有废片。

这两个AI,让你的国庆出行没有废片。

文章介绍了即梦AI的智能画布工具,它能够帮助用户在国庆出游时,通过AI消除和AI扩图功能,轻松修复照片中的路人和不完美的构图。即梦AI提供简单易用的网页版操作,而美图秀秀则提供了移动端的相似功能。作者推荐这些工具,希望能为读者的国庆旅游照片处理提供便利。

字节全新发布豆包AI视频模型 - 再见了Sora,你的时代过去了。

字节全新发布豆包AI视频模型 - 再见了Sora,你的时代过去了。

字节正式发布了他们全新的两款AI视频模型:豆包视频生成-PixelDance模型和Seaweed模型。

詹姆斯 · 卡梅隆官宣加入Stability AI,好莱坞要向AI投降了。

詹姆斯 · 卡梅隆官宣加入Stability AI,好莱坞要向AI投降了。

毕竟好莱坞都抵制AI这么久了,又是罢工又是抗议的,你大厂怎么直接下场表示支持AI了?不过那句话怎么说来着,孤掌难鸣,毕竟这一个单独的Case,还没有办法让那么多的反对者倒戈。但是今天,作为好莱坞电影人的精神图腾,詹姆斯·卡梅隆居然也跟AI走到了一起,甚至还不是发言表达,而是直接身体力行亲身参与这股革命浪潮中。

OpenAI全新发布o1模型 - 我们正式迈入了下一个时代。

OpenAI全新发布o1模型 - 我们正式迈入了下一个时代。

OpenAI发布了新的AI模型OpenAI o1,它在复杂推理任务上取得显著进展,重置了命名序列。o1模型通过Self-play RL学习,具备了慢思考的特质,能够进行深度思考和推理。在AIME 2024数学竞赛和科学问题GPQA Diamond上,o1的表现超过了人类专家。o1模型已向ChatGPT Plus和Team用户开放,提供o1预览版和o1 mini两种版本,API价格不等。

她决定开源AI模型,正面宣战“N号房2.0”。

她决定开源AI模型,正面宣战“N号房2.0”。

一起用身边的熟人作乐,甚至是威胁,还以AI视频+公开受害女性身份、家庭住址为理由,向受害人索要钱财。 这一次,最大的受害者群体,是学生。

Google发布Gemma 2 2B和Gemini 1.5 Pro,FLUX开源图像的新标杆,这就是这周的AI大新闻。

Google发布Gemma 2 2B和Gemini 1.5 Pro,FLUX开源图像的新标杆,这就是这周的AI大新闻。

本周AI大事件包括Google发布Gemini 1.5 Pro和Gemma 2 2B模型,FLUX开源图像模型,Meta发布SAM 2图像分割模型。Gemini 1.5 Pro在LLM竞技场排名第一,支持音频和视频,Gemma 2 2B可在设备端运行。FLUX系列模型包括FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell],

现在的AI公司们,已经在把用户当"数据提款机"了。

现在的AI公司们,已经在把用户当"数据提款机"了。

最近X(也就是以前的推特)和马斯克,就被这玩意,推上了风口浪尖。原因是,X被发现“光明正大”的拿用户的帖子来训练Grok AI。就是马斯克自己搞的那个大模型。

Meta发布Llama3.1,OpenAI推出AI搜索SearchGPT,Deepmind获得奥数银牌,这就是这周的AI大新闻。

Meta发布Llama3.1,OpenAI推出AI搜索SearchGPT,Deepmind获得奥数银牌,这就是这周的AI大新闻。

Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改进了对8种语言的支持。

看完了钉钉新发布的「AI搜索」,让我觉得,真香。
2024-06-28

看完了钉钉新发布的「AI搜索」,让我觉得,真香。

钉钉这个AI搜索,跟外面那些抓全网的AI搜索很不一样,不做全网搜索,主打搜索用户在钉钉里面所有的聊天记录、文档、会议、日程、知识库等等。

被AI改造后的meme梗图,已经变成了我看不懂的模样。

被AI改造后的meme梗图,已经变成了我看不懂的模样。

Meme梗图,代表网络文化中的模仿和传播现象,通常用于表达特定情绪或态度。近期,AI产品Glif推出了一个meme梗图生成器,由创始人fabian开发,能够根据用户输入的主题实时生成含有幽默和讽刺的梗图。这得益于最新的大语言模型Claude3.5,其创意和玩梗能力超越了许多人类,引发了广泛的关注和讨论。

Figma也开始卷AI了,设计师又要完蛋了?

Figma也开始卷AI了,设计师又要完蛋了?

UI设计师在AI时代面临挑战,Figma引入AI功能,如用语言生成UI界面、视觉搜索、自动命名图层等,提高设计效率,但也可能导致设计同质化。Figma还推出Slides功能,直接竞争Canva。AI提升了UI设计的下限,也要求设计师提高专业素养和创意能力。