本质上,他是不是大模型按照自己的知识库回答,然后先通过一些工程化手段,比如联网搜索,比如文档搜索等等,先把相关信息给找出来,让大模型根据这些信息来进行回答。
现在智谱直接接力,直接开源了他们内部效果最好的AI视频模型。智谱的新清影,跟上一代比,已经进步巨大了。不管是审美、还是动作幅度、还是物理规律、还是稳定程度。
然后就他写着写着,Prompt就越写越长。因为他发现,原来是可以把思考结构给封装进去的,他之前读了大量的这种工具书,脑子里全是各种各样的方法论,随便掏一个,就能咣咣咣咣大量的写。
谷歌准备推出接管计算机的人工智能。上周三Claude、周五智谱AI、周末Google,然后微软。短短一周内,已经有四个公司爆出来要发布类似的产品了,其中三个已经悄悄发布产品:Anthropic的Claude,智谱的AutoGLM和微软的OmniParser。这些产品的能力有目共睹。
Runway发布了Act-One功能,允许用户上传视频以驱动角色模仿面部表情。传统动画和动捕相比,Act-One大幅降低了制作复杂度和成本,仅需上传视频和图片,短时间内即可生成视频。Act-One不仅稳定性高,还能适用于不同风格的角色,对动画行业具有革命性影响,为创作者提供了更多可能性。
坦率的讲,要是两年前,我肯定得自己去徒手建模了。但是如今,让我自己再去建模那肯定不可能,C4D和Blender我打开都不想打开,作为一个AI博主,要是再回去手工建模,那简直就是就回到原始人了。
Claude 3.5 Sonnet和Haiku模型升级,引入新功能“计算机操控”。升级版Sonnet在性能上领先,具备编程能力和解决问题的实际能力。Haiku模型性价比高,击败大参数模型。新功能“计算机控制”允许模型执行在线任务,如浏览、点击和输入,模拟人与计算机互动。尽管目前功能仅对开发者开放,Anthropic相信模型将更好地融入日常生活,提升人机交互体验。
我直接放一个视频,你就可以,直观的体会一下他的强悍。比如,我对AutoGLM说:“我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。”
保持提示词简单直接:模型擅长理解和相应简单、清晰的指令,而不需要大量的指导。 当时我对这一条的理解,觉得是为了让o1模型更好的理解我的要求,同时可以加快模型的处理速度,因为模型不需要花费额外的时间去解析复杂的语句。
文章介绍了即梦AI的智能画布工具,它能够帮助用户在国庆出游时,通过AI消除和AI扩图功能,轻松修复照片中的路人和不完美的构图。即梦AI提供简单易用的网页版操作,而美图秀秀则提供了移动端的相似功能。作者推荐这些工具,希望能为读者的国庆旅游照片处理提供便利。
字节正式发布了他们全新的两款AI视频模型:豆包视频生成-PixelDance模型和Seaweed模型。
毕竟好莱坞都抵制AI这么久了,又是罢工又是抗议的,你大厂怎么直接下场表示支持AI了?不过那句话怎么说来着,孤掌难鸣,毕竟这一个单独的Case,还没有办法让那么多的反对者倒戈。但是今天,作为好莱坞电影人的精神图腾,詹姆斯·卡梅隆居然也跟AI走到了一起,甚至还不是发言表达,而是直接身体力行亲身参与这股革命浪潮中。
OpenAI发布了新的AI模型OpenAI o1,它在复杂推理任务上取得显著进展,重置了命名序列。o1模型通过Self-play RL学习,具备了慢思考的特质,能够进行深度思考和推理。在AIME 2024数学竞赛和科学问题GPQA Diamond上,o1的表现超过了人类专家。o1模型已向ChatGPT Plus和Team用户开放,提供o1预览版和o1 mini两种版本,API价格不等。
一起用身边的熟人作乐,甚至是威胁,还以AI视频+公开受害女性身份、家庭住址为理由,向受害人索要钱财。 这一次,最大的受害者群体,是学生。
本周AI大事件包括Google发布Gemini 1.5 Pro和Gemma 2 2B模型,FLUX开源图像模型,Meta发布SAM 2图像分割模型。Gemini 1.5 Pro在LLM竞技场排名第一,支持音频和视频,Gemma 2 2B可在设备端运行。FLUX系列模型包括FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell],
最近X(也就是以前的推特)和马斯克,就被这玩意,推上了风口浪尖。原因是,X被发现“光明正大”的拿用户的帖子来训练Grok AI。就是马斯克自己搞的那个大模型。
Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改进了对8种语言的支持。
钉钉这个AI搜索,跟外面那些抓全网的AI搜索很不一样,不做全网搜索,主打搜索用户在钉钉里面所有的聊天记录、文档、会议、日程、知识库等等。
Meme梗图,代表网络文化中的模仿和传播现象,通常用于表达特定情绪或态度。近期,AI产品Glif推出了一个meme梗图生成器,由创始人fabian开发,能够根据用户输入的主题实时生成含有幽默和讽刺的梗图。这得益于最新的大语言模型Claude3.5,其创意和玩梗能力超越了许多人类,引发了广泛的关注和讨论。
UI设计师在AI时代面临挑战,Figma引入AI功能,如用语言生成UI界面、视觉搜索、自动命名图层等,提高设计效率,但也可能导致设计同质化。Figma还推出Slides功能,直接竞争Canva。AI提升了UI设计的下限,也要求设计师提高专业素养和创意能力。