

大模子的竞争涓滴莫得冷却的迹象,OpenAI日前又甩出一个“王炸”——GPT-5.4,这是其初度将前沿推理、编码与智能体才气整合于单一模子,官方以为它是“现在面向专科职责推出的才气最强、效果最高的前沿模子之一”,绚丽着AI技巧从对话交互向自主智能体履行任务迈出重要一步。而这一趋势从这两天OpenClaw的全网爆火也可见一斑。OpenClaw不仅是对话机器东说念主,更是一个能自主判断、有贪图、履行任务的AI生命体。戒指现在,国内互联网大厂已纷纷跟进,腾讯电脑管家昨天上线AI助手器具QClaw官网,火山引擎则上线ArkClaw——开箱即用的云上SaaS版OpenClaw。
当智能体运转在东说念主们入睡后赞理处理各项事物,本年AI会给世界带来多大颠覆,值得期待。
AI比东说念主类更会操作电脑
GPT-5.4最具冲破性的改进在于其原生估计机使用才气。此前,不管是ChatGPT Atlas还是AutoGPT类智能体,均摄取外挂插件或寂寞智能体阵势,并非模子原生功能。

OSWorld-Verified是面前最泰斗的“估计机使用”评测基准,它测试AI代理奈何通过截图不雅察、鼠标键盘操作来完成任务,包括文献贬责、网页浏览、办公软件、多哄骗合营等场景的369个确切世界任务。GPT-5.4在该评测中获得75%的任务到手率,初度进步72.4%的东说念主类平均水平。
在另一款评估器具GDPval上,GPT-5.4的表示相同亮眼。GDPval是OpenAI于客岁9月推出的评估器具,其独到之处在于评测“明确任务下的寄托质地”,而非浅易的问答才气。评分摄取共业绩群众盲评对比——将“模子寄托收尾”与“东说念主类群众寄托收尾”并排盲审,由共业绩群众评判优劣。收尾傲气,GPT-5.4在83%的任务中表示即是或优于东说念主类群众,尤其在投行级电子表格建模、演示文稿生成和法律文告撰写等任务上,最初上风更为彰着。
智能体时间加快到来
“SeeDance2.0、OpenClaw、GPT-5.4……仿佛又回到了GPT-4刚发布时的那种嗅觉,每天齐有新变化,应接不暇。”上海东说念主工智能商讨院技巧中心主任林圆圆的一句打妙语,说念出了如今AI赛说念上“你追我赶”的近况,每支队列齐铆足了劲,配资门户网一次更新就能引来业内神气变动。
行业的范式升沉已浮现。本年头举行的清华大学AGI-Next峰会明确提议,大模子竞争已从“对话”阶段转向“智能体”阶段,履行才气不才半场竞争中至关病笃。2月,OpenAI首席履行官山姆·奥特曼文牍OpenClaw首创东说念主彼得·斯坦伯格加入OpenAI,发奋于鼓舞下一代个东说念主智能体的研发。
混名“小龙虾”的OpenClaw是当下最火爆的AI技俩。3月1日,OpenClaw以24.5万颗星登顶GitHub榜首,非凡遥远占据榜首的Linux和React。奥特曼评价说念:“彼得是一位确切的天才,他对改日高度智能的智能体奈何合营以业绩东说念主类有着好多令东说念主咋舌的构想。”
这一东说念主事变动对GPT-5.4的发布产生径直影响。有建树者不雅察到,GPT-5.4的多项中枢功能——原生电脑操控、100万token高下文、器具搜索带来的47%token老本省俭,偶合踩中了OpenClaw的技巧痛点。
大模子进入各异化竞争
GPT-5.4天然广大,但广大亦有领域。详尽来看,它在专科职责场景,异常是金融分析、办公自动化、常识职责中展现了显赫的才气提高,但在编程才气上逾期于Claude Opus 4.6,在科学推理上逾期于Gemini 3.1 Pro,在医疗健康鸿沟以致出现小幅雕零。另外,尽管GPT-5.4在OSWorld-Verified测试中照实非凡了东说念主类基准,但这仅仅在特定的369个任务上,且测试环境是可控的臆造机。在更复杂、更敞开确凿切场景中,AI与东说念主类的表示差距可能天壤悬隔。
如若说3年前的大模子还在团结条跑说念上竞争,那么,如今已很难用团结把标尺来预计“各怀绝技”的大模子了。正如一位业内东说念主士所言:“不再有‘最佳的AI’——想操控电脑、作念PPT、跑常识职责?选GPT-5.4;想写代码、跑智能体、作念复杂建树?选Claude Opus 4.6;想要最强推理、图片视频贯穿、最大高下文、最廉价钱?选Gemini 3.1 Pro。”
价钱详情是不得不议论的身分。GPT-5.4的输入价钱达到30好意思元/百万tokens,是Claude Opus 4.6的6倍、Gemini 3.1 Pro的15倍、MiniMax M2.5的100倍,十分于对GPT-5.4 Pro说一句“嗨”,模子想考5分钟就可能花掉80好意思元。
林圆圆以为弘盛策略,大模子的竞争最终将归于算力。东说念主工智能大模子的快速发展对高性能算力提议空前需求,算力瞻望还有成百上千倍的增漫空间。正在举行的世界两会上提议,本年国内将在包括电网、算力网、新式通讯网等在内的“六张网”等要点鸿沟参预进步7万亿元,这一布局好奇好奇要紧。
恒丰优配智慧优配配资网亿正策略兴盛网配资瑞金资本提示:文章来自网络,不代表本站观点。