来源:雪球App,作者: 天叢雲劍,(https://xueqiu.com/9094682924/335840428)
一、大厂与创业公司的策略分化:生态闭环 vs 垂类突围大厂:构建全链条生态闭环
核心路径:依托自研大模型(如字节豆包、阿里通义、腾讯混元)搭建平台(字节扣子空间、阿里百炼、腾讯元器),整合工具生态(MCP 协议),覆盖 “模型 - 平台 - 应用 - 用户” 闭环。
差异化定位:字节:全生态布局,聚焦 A2A(Agent-to-Agent)协同,依托抖音、飞书等场景落地。阿里:深耕医疗(乳腺癌筛查)、金融(智能投研)等垂直领域,结合淘宝、钉钉等商业生态。腾讯:侧重文娱(游戏 NPC 生成、内容创作)与办公自动化(企业微信 AI 助手),强化社交链整合。百度:面向 B 端,聚焦智慧城市、工业质检等产业场景,依托 AgentBuilder 平台赋能企业。
竞争重叠区:个人 AI 助手(如腾讯元宝、阿里通义客户端)、办公 OA(飞书 / 钉钉 / 企业微信的 AI 组件)成为共同战场。
创业公司:聚焦细分场景,规避生态短板
主流模式:套壳工具:基于开源模型或大厂 API 做轻量化应用(如文生图、代码辅助),2023-2024 年集中出现,但面临模型迭代滞后问题。垂类深耕:如 Lovart(设计领域 Agent)、Kimi(超长上下文 Chatbot),通过行业 Know-how 构建壁垒,避开通用 Agent 的高成本陷阱。
核心挑战:用户积累难(缺乏流量入口)、算力成本高(Token 消耗与服务器资源)、技术依赖大厂(如 MCP 需接入百炼 / 扣子空间)。
二、字节扣子空间的困境:通用 Agent 的 “理想与骨感”用户反馈两极分化的本质
期望落差:定位 “通用 AI Agent”,但实际处理模糊需求时效果差(如行程规划需多次猜测用户意图)、流程不稳定(任务中断率高)、Token 成本高昂(单次指令 1-3 元)。
MCP 整合难题:虽免费接入高德地图、法律文书等工具,但跨服务调度效率低,且缺乏行业深度适配(如公文写作无真实 Know-how,依赖幻觉)。
成本与技术瓶颈
算力负担:Token 成本(豆包 3 元 / 百万 Token)+ 服务器资源(长时任务独占并发,成本为 Chatbot 的 5-10 倍)+ CDN 流量,仅大厂可承受。
模型代差:国内大模型(如豆包)在逻辑推理、工具调用准确性上较 Claude 3.7 仍有半年到一年差距,Qwen3 虽提升 MCP 支持,但生态成熟度不足。
转型建议:
收缩预期:从 “通用 Agent” 转向 “垂类 Agent 聚合平台”,鼓励开发者基于行业 Know-how 构建细分工具(如律师办案助手、设计师素材生成器)。
轻量化路径:参考 Lovart,通过限定场景(如营销文案生成)降低交互复杂度,提升任务完成率。
三、垂类 Agent 的崛起:Know-how 驱动的确定性机会为何垂类更具潜力?
需求明确性:如设计领域(Lovart)、编程(Cursor)、客服(智能应答),用户目标清晰,工具调用路径可预设,降低幻觉风险。
成本可控性:单一场景 Token 消耗低(如代码补全仅需数百 Token / 次),且可通过本地 LoRA 微调提升效果,减少对云端算力依赖。
商业化可行:B 端付费意愿强(如企业采购设计工具、医疗影像分析),且可通过 SaaS 订阅、私有化部署收费。
成功案例与关键要素
Lovart:聚焦设计师群体,整合素材库、尺寸适配、风格迁移等工具,通过海外市场(使用 Claude/Sora)快速验证,再回流国内适配 Qwen3。
核心壁垒:行业数据:积累设计领域 prompt 库、历史项目案例,提升生成内容的专业性。交互体验:界面深度集成设计软件(如 Figma),减少用户跨平台操作成本。用户粘性:通过用户创作历史训练个性化模型,形成 “越用越懂我” 的正反馈。
四、技术与商业化:MCP、算力与付费模式的博弈MCP 的生态博弈
大厂策略:当前 MCP 服务(如百炼 / 扣子空间)以免费为主,抢占开发者生态,但未来可能对高频调用(如电商选品、金融数据查询)收费,模式类似 API 市场。
技术门槛:Qwen3 首次实现 MCP 原生支持(幻觉率显著降低),但字节 / 腾讯等厂商的模型仍需优化工具调用准确性(如生成合法 JSON 格式的成功率)。
算力成本的 “不可能三角”
通用 Agent:高 Token 消耗 + 长时算力占用,仅适合 To B 大客户(如企业级流程自动化)。
垂类 Agent:通过轻量化模型(如 1B 参数 LoRA)+ 端侧算力(如本地 GPU)降低成本,适合 To C 场景。
商业化路径探索
当前阶段:以 Token 流量计费为主,但用户付费意愿低(对效果不确定性担忧),企业级服务(如医疗 AI)通过项目制收费更可行。
未来方向:价值分层:按问题复杂度收费(如法律咨询高价、日程安排低价)。订阅制 + 增值服务:基础功能免费,高级功能(如定制化模板、团队协作)收费。B 端场景:聚焦 “降本增效明确” 的领域,如客服替代、代码生成,通过 ROI 说服企业付费。
五、风险与机会:政策、技术与生态的再平衡风险点
政策监管:国内对生成式 AI 的内容安全、数据合规要求趋严,可能限制通用 Agent 的场景拓展(如金融预测、医疗诊断)。
生态依赖:创业公司过度依赖大厂平台(如扣子空间)可能面临接口变动风险,需构建自有技术栈(如开源 MCP 框架)。
机会点
出海红利:利用海外模型(Claude/GPT-4)的技术优势,先在海外验证垂类场景(如跨境营销 Agent),再回流国内适配国产模型。
行业深度合作:与传统企业共建垂类 Agent(如制造业工单处理、零售业库存预测),结合行业数据训练专属模型,形成壁垒。
总结:从 “大而全” 到 “小而美” 的范式转换当前国内 AI agent 生态正从 “大厂主导通用平台” 向 “垂类场景深耕” 转型。大厂需在生态整合与场景聚焦间找到平衡(如字节收缩扣子空间的通用野心,强化飞书的办公场景),而创业公司应避开与大厂的正面竞争,通过 “行业 Know-how + 轻量化技术” 切入细分市场。未来 1-2 年,具备明确商业价值(如降本增效)、低幻觉风险(如结构化数据处理)的垂类 Agent,将成为商业化落地的主力。