Agent热度飙升,一场暂被高估的“效率游戏”
从天使轮押注DeepWisdom到目前新轮融资,远望资本创始合伙人程浩的投资回报颇丰。AI+创始人和投资人段雨嫣对记者表示,近期Agent概念因基座模型技术的成熟而热度提升,美国硅谷几乎每一家公司都在做Agent。
创业者群体中,Convergence AI 工程负责人郑浅对记者表示,海外市场垂类Agent早有案例,相对来说,通用类Agent在OpenAI相关产品发布后热点得到提升。在Pokee AI创始人、前Meta应用强化学习负责人朱哲清的体感上,去年下半年,他所接触的VC还没有一家十分清晰地理解公司为什么做、怎么做Agent,而今年春节前后,包括投资人与潜在客户,大批行业人士前来向他咨询Agent相关的问题。
整个人工智能领域热度的逐渐高涨,背后是不同时间点不同“爆款”AI产品的助推。包括DeepSeek在春节期间完成对大众关于大语言模型的教育与普及,1月OpenAI Operator清晰演示了AI Agent的样板;3月Manus的出圈启动了对Agent市场的教育。
市场研究机构Gartner 将 Agentic AI 列为 2025 年十大技术趋势之一,并指出到 2028 年至少 15% 的日常工作决策将通过 Agentic AI 自主完成。记者调研观察,目前海外市场中,Agent基于资本对技术长期投资、相对充裕的算力支撑、付费习惯较成熟、资本对技术创新与商业化进展的包容等原因,已有不少案例。但在国内市场中,Agent暂处于大厂战略布局范畴内,尚未大范围涌入普通用户的生活中。
Agent革新与乱象并存
Agent可以翻译为代理、智能体、助理等,概念最早萌芽于1959年,用于解释更大系统的自主行为。2010年之后,基于大模型驱动,Agent逐渐具备跨任务知识迁移和快速学习能力,如微软推出 Microsoft 365 Copilot,通过 Agent 自动化办公流程;OpenAI旗下ChatGPT 插件生态赋能第三方工具集成;谷歌Project Astra 打造个人智能助手,整合搜索与多模态能力。
至于大语言模型(LLM)与Agent之间的关系,前者接收文字、图片等内容,输出相应文字或图片,但没有记忆,无法连接真实环境或操作外部工具。Agent以LLM为“大脑”,加上记忆与躯体,可以感知环境、记忆过程、执行任务、规划与行动。
近期海内外热点事件推动,伴随模型技术提升,Agent热度渐起。郑浅对记者表示,2025年1月,OpenAI发布Operator之后,Agent行业启动了新一轮的热潮,Convergence AI初期也获得1200万美元Pre-seed投资。此前国外市场中,垂类Agent较为丰富,如聚焦医疗、金融、法律等具体场景。基于方便落地、痛点解决精准而获得客户买单。而Operator“打样”之后,通用型Agent行业开启了新轮热潮,创业者开启项目推进,VC前来咨询项目技术更新。
另一种分类方式在郑浅看来,也可以分为已经落地的通用型Agent、备受关注的开发中产品,以及为Agent AI提供服务的产品。通用型如OpenAI的Operator,系行业第一个真正落地的通用协议型Agent,目前仅限美国地区使用;Convergence AI Proxy在Operator亮相两天后向公众开放,专注于研发Agent;Anthropic的computer use是一个企业级API服务,严格来说不算产品。但它的推出为这方向的AI产品奠定了技术基础,影响深远。
开发中的产品如谷歌的Project Magi,最初Demo在去年12月,核心方向偏向人机交互,目标将AI Agent整合到Chrome浏览器中,但目前官方未透露更多细节。服务型产品如BrowserBase和Browser Use,是为浏览器Agent提供虚拟浏览器服务的公司;Microsoft Azure正在紧锣密鼓研究为AI Agent提供虚拟机服务。
另外,目前Agent也可粗浅分为垂直型与通用型。Monica虽然官方宣称推出通用型AI Agent Manus,官方演示案例中涉及了简历筛选、股票分析、购房推荐、课程设计、文娱创作等多个种类,输出形式包括文档、图像、音频、Dashboard等不同类型的输出。但由于垂直功能不够精准,反而侧面证明通用型Agent目前难以完成垂直功能的“专精深”。
需注意的是,Agent热度的暴涨也使得目前行业存在“Agent Washing”(智能体清洗)的乱象。AW是指AI领域中,部分企业通过重新包装现有技术或简单自动化工具,宣称其具备 AI Agent功能,但实际并未验证或实现真正的自主决策、学习和适应能力的现象,利用市场对 AI Agent 的热度进行营销,导致市场混淆和误导性投资。
具体如将传统的聊天机器人、RPA(机器人流程自动化)工具或基于规则的系统重新命名为 “AI Agent”,但核心功能仍依赖预设指令或简单逻辑,缺乏自主性。或者宣称产品具备 “自主决策”“持续学习” 等能力,但实际无法处理复杂环境或未预见情况,如将简单的邮件自动回复工具称为 “销售智能体”,将固定流程的客服脚本包装为 “智能服务代理”。还有一种是模糊 “AI 助手”“工具” 与 “AI Agent” 的边界,如将仅提供信息检索的工具宣传为具备独立行动能力的智能体。
AI Agent行业早期,泛滥的“Agent Washing”乱象可能导致企业因误判技术价值投入资金,却未能获得预期的自动化或效率提升,导致资源浪费;用户对AI Agent的实际能力产生怀疑,阻碍真正创新技术的落地;以及虚假宣传掩盖实时性差、可解释性弱等真实技术瓶颈,导致市场过热与后续回调风险。在具体判断与界定上,用户可以通过相关产品能否在无人工干预下完成任务、是否支持动态优化策略、能否应对未预设的场景、能否清晰展示决策过程、是否支持与其他系统或人类协同工作等方面进行区分。
垂类与通用Agent将并存
那么,Agent具体是何如运作的?
在工作模式上,吴恩达此前提及,在应用中构建具有Agentic推理或Agentic工作流的方法有四种主要设计模式:反思型设计模式、tool use(API calls功能调用)、规划或推理、多智能体协作(Multi-agent Collaboration多智能体协作)等。
在这样的工作方式分类逻辑下,Manus以明显的tool use形式破圈传播。但在用户使用端,多位行业人士对记者表达了“早期阶段”的判断。一位AI领域从业者对记者表示,Manus在长期任务中表现较差,多个步骤的任务会因为每一步的细微误差被放大,导致最终失败。核心问题是工具能力较差,虽做了规划和计划,但实际执行出来的效果不及预期,所以导致整个任务失败。这方面的原因不在规划能力,而是规划了却没有足够的tools去执行,或者tools太简单,导致复杂问题无法处理,而tools丰富生态的搭建需要足够资金实力支撑才能破解。
另外,行业人士对记者表示,Manus目前属于“堆tools”的形式,而这种形式无法进行持续进化。朱哲清也认为,做Agent需要考虑的几个板块包括通用性、算力部署要求、工具调用能力、执行力。其中,工具调用是比较复杂的问题。
AI工程师、Pleias联合创始人 亚历山大·多里亚(Alexander Doria )此前发文表示,未来 AI 智能体的发展方向会是模型本身,而不是工作流(Work Flow)。而Manus 基于预先编排好的提示词与工具路径构成的工作流智能体,短期或许表现不错,但长期必然遇到瓶颈,核心原因就是提示驱动的方式无法扩展,也无法真正处理那些需要长期规划、多步骤推理的复杂任务。
中金公司研究部认为,相比于上述海外厂商在Agent底层技术上的创新,Manus更多是一种模式上的创新:Manus证明了多代理模式可以相对容易地实现通用AI Agent的落地,这也与海外厂商推出构建模块、统一API协议的目的比较类似;“展示过程”的形式有助于降低大众的理解门槛,提高用户对AI产物的信任度,并催化AI Agent实现大规模落地。
中金公司引用LangChain(专注于AI应用开发的开源框架提供商)调查报告显示:人们在长耗时任务中对AI Agent有较大需求,但同时,用户对AI Agent普遍存在“完成质量”或“可靠性”方面的担忧,AI Agent在复杂场景中并不一定能够持续保持响应和问题解决路径的准确性,因此有一半以上的受访者在实际使用中会为AI Agent补充跟踪和观察的控件。
抛开通用Agent早期尚存的不足,郑浅更看好通用型Agent的前景。一方面,OpenAI的Operator已经为行业“打了样”,另一方面,通用型可以通过简单化任务、小体量模型完成,在海外算力较为充足的背景下,通用型Agent比拼的主要是小模型与工程能力。模型不是越大越好,而是适合才好,工程也是Agent领域重要影响因素。
更重要的是,郑浅认为,通用型Agent可以同时自主完成不同任务,具备规划和重新规划能力,而实现这一功能的核心就是Agent另一个“大脑”——Agent Orchestrator。上文所提LLM是Agent进行思考和决策的核心组件,在多Agent系统中,LLM负责单个Agent内部语言处理和决策,Agent orchestrator负责决定哪个 Agent来处理特定的任务,以及如何在多个 Agent 之间传递信息,让Agent各司其职,最大化效率。
基于这样的逻辑,郑浅判断通用型Agent中,并行Agent将是未来趋势。但整个行业内,垂类Agent将与通用Agent长期并存甚至达成“合作”,例如垂类工具接入通用Agent平台,补足后者在具体行业方面的欠缺。
大厂蓄势,行业尚早
任何一个新兴领域,创业者都免不了面临“大厂来了”怎么办的问题。程浩称:PC互联网时代,VC对创业者最常见的问题是“你这个项目如果腾讯做了怎么办?”进入AI时代,VC仍然会问此类问题,只是腾讯变成了字节。
据记者了解,字节跳动Dev Infra团队已开发出一款功能类似Manus的智能体产品,名为Dev Agent,主要通过集成内网知识库与多种内部工具实现调研、开发、数据分析等任务。记者获悉,Dev Agent是一款实验性质的内部工具,仅面向开发部门内测使用。
在技术方面,字节此前提出基于强化学习(RL)的 LLM Agent 框架 AGILE,会主动向人类专家咨询,增强了快速适应新任务的泛化能力。产品方面,“Coze 扣子” 作为 AI bot 开发平台,堪称字节版GPTs,提供丰富的Agent工具。目前豆包电脑版APP已呈现浏览器模式,将已有AI工具汇总调用,输入“撰写一段贪吃蛇的代码并运行”,豆包可调用工具、演示过程、最终运行。
阿里主推的AI时代代表应用夸克近期推出“超级框”概念,阿里巴巴智能信息事业群总裁的吴嘉表示,“超级框”不是ChatBot或搜索,而是直接交付结果的“超级Agent”——用户在“框”中表达意图,AI会调用工具与方法来帮你写一份工作报告、旅游计划,或是一份就医指南。
目前在整个阿里集团战略布局中,夸克被寄望于搭建AI时代“超级入口”,但同时,作为试水探路者,目前夸克方面暂未尝试重投入,因此在Agent模式上,暂时处于阿里自有工具调用的早期形式,未接入增加更多算力耗费与技术复杂性的中间调优与反馈。
除上述大厂案例,记者观察到的主流Agent代表案例暂时集中于海外市场。谈及海外大厂的竞争,郑浅对记者表示,各行业有各自专攻领域。OpenAI、Anthropic及Deepmind在模型研发方面确实强大,但他们在产品开发方面表现不佳。如过去两年OpenAI推出了GPTs或Prompt Store等多款产品,但大多是失败的。
另外,Agent公司的创业核心竞争力在于其Agentorchestrator。目前虽有开源模型,但没有人开源真正的Agentorchestrator,各家公司都有独特做法。如何构建有效的AgentOrchestrator的能力在未来一两年内都将是Agent创业公司重要的核心竞争力。
目前在Agent生态构建呈现大厂定制规则、创业公司冲刺创新的局面,大厂相继推出构建模块、构建平台等Agent开发工具,打造专有生态。
2025年3月11日OpenAI发布了其第一组构建模块,通过Response API,用户通过几行代码调用OpenAI的内置工具来构建符合自身需求的Agent,而无需再专门编写调用外部工具的复杂代码,大大简化了Agent开发的流程。区别于建立一站式构建平台,Anthropic推出MCP开放标准,同样致力于提升Agent开发能力和效率。
但目前行业对MCP持有不同观点,郑浅对记者表示,MCP 更像是一个 API,虽然使用起来方便,但其可扩展性和适用性都有一定局限。如果要构建真正的通用型 Agent,仅依靠 MCP 的接口会受到限制,因为支持的软件有限。
朱哲清告诉记者,长期来看,协议统一对于某个Agent体系的构建非常重要,但目前来看,协议在短期内不会有共识,原因在于还没有哪家Agent公司已经做到最好。要等出现一家公司将Agent商业化应用做到很好的情况下,才会吸引很多人用它的工具,才有可能统一市场。而目前,即便是较早面世的MCP,所带来的价值也有限,MCP可以帮助工具标准化,但大多数情况下工具都不是标准化的。Claude集成的MCP Agent也更多处于开发者测试和体验的状态,还没有到商用的程度。