7月,全球AI算力龙头的股价,创出了历史新高,再次登顶全球市值第一。短短过去3个月,似乎再无人提起大模型的预训练“撞墙”这事了,算力需求的担忧似乎又被延后了一年。
过去3个月,大模型往Agent应用的“中级”目标迈进。大模型有了长期记忆,通过MCP可以对接大量人类使用的工具、数据库和代码,通过A2A协议可以在垂直Agent之间进行协作,与人类的沟通也不再局限于文字,图片乃至视频的精准理解和生成,都在拓宽着Agent的工作领域。AI从一问一答的“聊天工具”,进化成了为人类打工的“任务机器人”。
在所有Agent的落地场景中,AI编程的渗透率上升最快。从代码检查与修正,到代码续写,再到自然语言的代码自动生成,AI编程在逐步往Agent的方向靠拢。去年9月份全球第一款推理大模型GPT o1发布后,AI编程插件Github Copilot的用户渗透率飞速发展,一年时间从10%上升到50%,全球收入也增长到了5亿美金。而随着Agent框架的逐步完善,编程Agent —— Cursor的增速更是超越了Copilot,从2024年初起步至今,收入已过微软的Github Copilot,这得益于Agent产品不仅拉高了产品单价,还因更低的使用门槛,在开发者的关联人群(例如设计师、产品经理等)中迅速破圈,用户技术被放大。但即便未来用户人群上亿(目前全球开发者约3000万人),终极年化收入也仅百亿体量。编程Agent的迅速破圈,更大的影响在于,软件世界的产出量会因此出现爆发式增长。
以微信小游戏为例,这几年AI生图与编程的能力的进步,使得游戏制作的成本和速度大幅下降,这对于小游戏来说,无疑是“数量级”的优化。2024年中国小游戏市场收入达398.36亿元,同比增长99.18%,2025年市场收入预计将超过600亿-700亿,成为体量比肩端游的细分市场(仍远小于手游2000多亿的市场)。一方面,游戏制作的分散度在大幅提升,玩法众多,头部游戏集中度较低;另一方面,游戏人群的数量也在快速增长,尤其是女性和中老年玩家,比端游和手游出现了较大的增长。
在此背景下,全球软件设计平台——F公司于本月最后一天上市,掀起了美股短期的一轮小高潮。公司靓丽的增长数据也是受益于AI编程的拉动,在未来世界数字产品大爆发的预期下,上市当天直接开出了50倍PS的极端估值。
与此同时,Agent在广告业的应用也开始初见成效。全球最大的两家广告巨头——M公司和G公司,二季报皆超出了市场预期。AI技术在其中发挥了很重要的作用,既改善了广告推荐效率(提升CPC与CTR),也提升了内容推荐的需求(提升用户留存时长或搜索次数)。除此以外,两家公司增长的主要驱动之一,还来自同样一块新业务——广告投放自动化(Advantage+与PerformanceMax业务)。广告主,尤其是中小企业主,过去需要自建广告制作与投放团队,现在可以通过这两大平台的广告投放Agent,进行广告的AI制作与流量筛选投放,可以缩小广告主的团队规模节省开支,也激活了许多不擅广告投放的中小商家的需求。
而在通用Agent领域里,Openai也于本月正式加入竞赛,在中国创业公司Manus和Genspark之外,成为全球第一家推出“通用Agent”的大模型厂商。当前通用Agent的市场,被Manus和Genspark占据了绝大部分,但实际上Agent能够独立完成的任务种类并不多,主要通过搜索引擎、文档、表格、PPT等工具的使用,来完成一份研究报告,而浏览器和手机操作系统的使用却依然不如人意。Manus和Genspark的工作更多依赖于内置的工具,通过预设的Workflow流程来使用工具,极大地提升了工具使用效率和任务完成速度,但泛化性就受到了限制。Openai则希望使用推理模型和MCP协议,在任务执行过程中,通过强化学习来探索完成任务目标的最佳执行链,优点是泛化性很强,可以探索学习使用不同的外部工具和任务种类,但许多工具的早期使用非常生疏,效果差,时间长,成本重。两种技术路线,需要在效率与泛化性之间去找平衡。
虽然在Agent的各种场景中,能实现完全闭环,无须人工干预的任务还不多,但令人期待的是,Agent正在打开“AI自我学习”的正循环。现代强化学习的奠基人Sutton曾经写过一篇名为《惨痛的教训》,一直被Openai奉若圣经;今年4月,Sutton发表了名为《欢迎来到经验时代》的论文,对比了“人类数据时代”和“AI经验时代”的区别:当前 AI 靠人类生成的静态数据(如互联网文本、图像)训练,即“数据时代”,但人类原创数据已接近饱和,难以产生真正新知 。而Agent一旦落地真实世界,以第一人称来执行任务和互动,产生动态、高定制化的“经验数据”,其价值将远超静态训练集,接近生命本质——如婴儿成长过程中,通过感知与互动生成海量经验性反馈的认知机制。
过去的AI像一名会失忆的天才毕业生,学到了丰富的知识和严密的逻辑思维,但智商却永远止步于校园的最后一天,上班后便不再学习。而现在的Agent可以在不同的任务当中,累积工作经验,持续地学习提高,并且可以通过强化学习,主动探索完成各种任务的最佳路径。
扎克伯格在财报电话会的开头便特意强调了这个现象:在过去几个月里,已经开始观察到AI 系统自我改进的迹象。我们在使用GPT Agent的过程中,也发现了在几个相同研究任务之间,Agent完成时间会不断缩短,而不是简单地重复预设流程指令。第一次接触任务时,Agent需要搭建执行链,在规划、探索和反思之间,不断进行搜寻和测试,找到最优执行链,相当于做了一次以任务要求和用户反馈为奖励函数的强化训练/RLHF,这个过程需要很久的时间,例如超过半小时。而当在不同对象上重复相同类型的任务之时,已经搭建的执行链,会稍微修改后快速执行,任务完成时间会逐次缩短到数分钟。
这种在应用层面进行主动探索和持续学习的能力,是AI“经验时代”的最重要特征。所以,来自我们人类所积累的“数据”已不再是AI的天花板。而相比人类的经验,AI的经验还有两项决定性优势:其一,AI经验不会随个体“消亡”,可以长期保存、快速复用;其二,这些经验可以即时被复制并部署至其他用户的任务中,具备“经验共享”的天然机制。这使得AI的学习效率和迭代能力将远超人类。
就像当年AlphaZero通过自我探索和经验累积,战胜了李世石,从此将人类围棋水平远远甩在了身后;如今的Agent也有望通过强化学习和与真实世界各个领域的互动,走出一条惠及全部人类岗位的AGI道路。而当这样的Agent广泛被部署于全球各行各业,为80亿人服务时,算力也必将像水和电一样,成为新的基础要素,支撑数字文明的每一个角落。
风险提示及免责声明:市场有风险,投资需谨慎。在任何情况下,文章中的资讯仅供读者参考之用,文中提到的公司亦仅为阐述产业逻辑,所有内容均不带任何投资建议,读者不应单纯依靠本文而取代个人的独立判断。对于因使用、引用、参考本文内容而导致的投资损失、风险及纠纷的,东方港湾不负任何责任。