2025年,AI行业上演了一幕耐人寻味的“冰与火之歌”。

字节跳动携“豆包手机助手”高调入局,试图通过与中兴的合作,将AI打造为智能手机的“大脑”与“灵魂”。搭载豆包助手的工程样机首销即被抢空,二手市场溢价翻倍,业界一度将其视为“AI自主执行时代”的里程碑。

然而,仅仅几个月后,这款被寄予厚望的AI手机便陷入了四面楚歌的境地:微信、支付宝等超级App集体封杀,盟友厂商接连倒下,头部大厂纷纷自筑高墙。曾经风光无两的豆包手机,最终沦为一场高开低走的行业注脚。

与此形成鲜明对比的,是一个名为OpenClaw的开源项目。这个被网友戏称为“小龙虾”的AI智能体框架,在GitHub上狂揽超26万颗星,英伟达CEO黄仁勋公开称其为“我们这个时代最重要的软件发布”。英伟达、阿里云、腾讯云、火山引擎争相接入,华为、小米、荣耀纷纷将其融入自身生态,甚至出现了“摆摊免费安装小龙虾”的热潮。

同一个技术本质——系统级AI Agent,让AI跨越“聊天”的门槛,代替人类接管屏幕、键盘与鼠标,跨应用去“动手干活”——却走向了两种截然相反的命运。这背后,不仅是技术路径的差异,更是一场关于商业策略、生态博弈与时代逻辑的深层较量。

1

豆包的困境:动了超级APP的蛋糕

豆包手机的核心逻辑是视觉识别,它像人一样“看”屏幕,理解界面上的按钮与内容,再模拟手指点击操作。兼容性极强,无需App配合。

但问题也随之而来。据媒体测评,豆包助手申请了超过100项系统权限,其中近40%属于高敏感权限,能够读取短信、获取精确定位、静默安装应用,甚至能截取到银行密码键盘这类本该受保护的界面。如此之高的权限,注定它无法在巨头林立的移动生态中安然生存。

豆包手机发布仅三天,微信便率先发难。大量用户反馈,在使用豆包助手跨应用操作微信时,系统频频触发“登录环境异常”警告,账号被强制退出。紧接着,阿里系App、建行等金融类应用也纷纷加入封禁阵营。

这背后,固然有数据安全的考量,但更深层的博弈在于:没有哪家互联网巨头能够容忍竞争对手通过系统级AI助手把控自身的流量入口。豆包手机就像一把万能钥匙,能打开所有App的门,还能把门里的数据搬走。淘宝花了十几年建起的用户行为数据、微信费尽心思打造的社交关系链,一个AI助手直接读屏就拿走了,用户甚至不需要打开App。豆包想成为用户与数字世界的唯一中介,这恰恰是所有大厂都无法接受的。

与此同时,硬件端的盟友也在迅速萎缩。受AI服务器算力需求爆发等因素影响,存储芯片价格暴涨。联想集团董事长杨元庆在今年2月的财报会上坦言,上季度存储价格涨幅已达40%至50%,本季度涨幅可能要翻番。曾经积极接洽的魅族最终也未能挺过洗牌,与华硕一道黯然宣布暂停手机业务更新;realme宣告结束独立运营,全面回归OPPO集团;传音2025年归母净利润暴跌超五成。

中小厂商接连倒下,而头部厂商显然更不可能成为豆包的盟友。华为从HarmonyOS 4全面接入盘古大模型开始,就明确了小艺不只是一个语音助手,而是操作系统的大脑;荣耀推出YOYO,主打电商比价、外卖点单等跨应用操作;vivo发布自研蓝心大模型矩阵;小米则挖来前DeepSeek研究员罗福莉坐镇AI模型研发。对于这些头部手机厂商而言,将系统底层权限拱手让给字节,无异于把自家后院的钥匙交给别人。

豆包手机的盟友,真的不多了。

2

OpenClaw的破局:开源赋能的利益共同体

与豆包的封闭路线截然不同,OpenClaw选择了一条去中心化的开源路径。

OpenClaw基于Anthropic提出的MCP协议,将AI能力拆解为三层:核心层调用大模型,适配层连接不同IM平台,技能层执行具体任务。这意味着,开发者不再为某个特定的聊天平台打工,而是为AI本身开发技能。一套技能写好之后,可以在飞书、钉钉、微信等多个平台上复用。AI能力第一次与聊天平台彻底解耦。

更重要的是,OpenClaw的设计理念是本地运行。用户可以将其部署在自己的电脑或云服务器上,用自己的API Key,用自己的模型,而不用将数据上传到某个特定厂商的云端。对互联网大厂而言,OpenClaw不仅不可怕,反而是一个巨大的商业机会。因为它需要部署在云服务器上,需要调用大模型API,天然拉动云服务和算力消耗。

于是出现了这样的奇观:在美国,Meta试图挖角OpenClaw的创建者,谷歌在内部屏蔽对OpenClaw的访问,Anthropic甚至发出措辞礼貌的法务邮件;而在中国,火山引擎、阿里云、腾讯云几乎第一时间全面开放了运行OpenClaw的云端服务,甚至摆摊免费安装。MiniMax推出MaxClaw,小米发布国内首个手机版Xiaomi miclaw,华为将OpenClaw与鸿蒙生态深度融合,推出小艺Claw。国内大厂们直接杀入了美国云巨头还在观望的空白腹地。

用开源社区的项目,养自家模型的调用量,这笔账怎么算都划算。

3

分岔路口的选择:三种核心区别

豆包手机与OpenClaw的走向截然不同,根源在于三个关键选择。

第一,透明性:黑箱 vs 开源

豆包助手是闭源系统,运行逻辑和数据用途对外不可见,大厂无法信任。

OpenClaw完全开源,用户可以审查代码、自己部署、自选API。大厂不需要信任字节,只需要信任自己能审查的代码。

第二,定位:中介 vs 工具

豆包试图成为用户与数字世界的“唯一中介”,所有行为数据和交互轨迹都掌握在字节手里。对微信、淘宝们来说,这是赤裸裸的入口抢夺。

OpenClaw只提供工具,不掌控任何入口。它帮用户完成任务,但用户最终去的还是那些App,大厂不需要担心它抢流量。

第三,商业模式:数据掠夺者 vs 算力消耗者

豆包是“卖硬件 + 卖数据”,用户行为数据流向字节生态,对大厂而言是在抢核心资产。

OpenClaw帮云厂商卖算力。它需要部署在云服务器上、调用大模型API,一次任务消耗数十万Token,是普通用户的几十倍。对苦于算力卖不出去的云厂商,OpenClaw是完美的“算力消耗者”。

4

超级入口的陷阱:AI时代,安全才是真正的入场券

豆包与OpenClaw的对比,折射出一个更深层的问题:AI时代,到底需要什么样的产品形态?

过去20年,互联网的故事就是一部超级平台的成长史。微信、淘宝、抖音,这些平台的共同特点是:用户的时间和注意力,都被困在一个个围墙花园的App里,流量、数据、交易都在平台的掌控之中。

豆包想做的是另一种控制——它不建花园,建收费站,想去别的App得先经过它。但两种模式的底层逻辑其实一致:都想成为用户数字生活的控制点。

而OpenClaw代表的,是一条完全不同的路:不掌控任何入口,只提供能力。这让人想起当初互联网的HTTP协议——它不属于任何一家公司,是开放的、标准的。如果当年有人要做“互联网超级入口”,就不会有今天的互联网。

AI时代也一样。不会有AI时代的超级入口,因为没有任何一家公司能让所有人都信任、让所有App都接受。只会有“AI时代的HTTP”——一个开放的、本地的、用户自主控制的AI能力层。

但通往这个未来的路上,安全是绕不过去的坎。

当AI助手开始会搜索、会浏览、会记忆、会调用工具、会上传文件时,它就不再是聊天机器人,而是一台接入真实世界权限的执行系统。搜索结果不再是信息入口,而是潜在的攻击入口;提示词不只是文本,而是控制权。最近曝光的“Claudy Day”攻击链就是例证:攻击者通过搜索引流、隐藏式prompt injection、数据外传三步,让模型在用户毫不知情的情况下,将对话历史中的敏感信息上传到攻击者账户。

AI安全的主战场正在从“模型说什么”的内容安全问题转移到系统边界控制问题。未来真正决定AI公司生死的,不只是模型能力,更是如何处理这些边界:外部内容与内部控制的边界,用户意图与第三方注入的边界,可读权限与可执行权限的边界,上下文记忆与数据外传的边界。

围墙正在倒塌,但路还没修好。谁先把这些边界补起来,谁才有资格谈Agent落地。

声明:本文来自小贝说安全,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。