
今天凌晨发布的 GPT-5.3-Codex 不错说是 OpenAI 对这段时辰来松原钢绞线价格表,多样土产货 Agent 爆火的记重拳顽抗,天然主若是对 Anthropic 的反击。
配 OpenAI 前几天的发布的 Codex 桌面版愚弄,Skill、Cowork、Claude Code,以至是 Openclaw,这些热点器具能杀青的,当前通过 Codex 的外壳 + GPT-5.3-Codex 模子才气,皆能作念到了。
▲ 在 Codex App 内不错平直选拔 GPT-5.3-Codex 模子,也能选拔度念念考的强度
和之前先容 Cowork 的才气样,咱们也丢了些近似的任务让 Codex 来完成,像是平直处理土产货文献、多样步伐调遣、调用不同的 Skills 组才气、作念 Word/PPT/Excel、下载、开导 App……
GPT-5.3-Codex 的进展照实亮眼,比较较重新运行安设 Claude Code,对新东说念主用户来说,当前平直下载 Codex 会是个好的选拔。这亦然异日模子厂商的种趋势,运行大皆是从黑乌乌的号召行终局运行作念土产货 Agent,接着皆冉冉追思到可视化的友好界面。
网上对 Codex 的评价在这几天也有了不少逆转,许多开导者从 Claude Code 转向 Codex,些在国内的立开导者也暗示 Codex Plus 会员就不错用,而且还不会像 Claude 那般老是情封号。
奥特曼是欢跃的文书,Codex 的活跃用户也曾过 100 万。在模子新博客,亦然绝不遮挡和留过剩地的夸赞,
GPT-5.3-Codex 是咱们个粗略自我构建的模子。通过使用 5.3-Codex,咱们粗略以如斯快的速率发布 5.3-Codex。
跟 Claude 团队用两周的时辰,使用 Claude Code, AI 代码,搓出个 Cowork 样;还有 OpenAI 前年年底发布的著作,「使用 Codex 在 28 天内构建 Android 版 Sora」,Agent 的期间果真来了。
用 Codex 取代我的 ChatGPT 和 Claude Code
和大大皆的土产货 Agent 样,论是终局照旧 Cowork,咱们皆是先选拔个使命文献夹。在 Codex 中,咱们不错创建多个 Project,选拔对应的文献夹,再高出运行对话,Codex 把它们叫作念 Threads 线程。
先用宽阔和绵薄的例子,咱们添加了个空的下载文献夹,然后运行个线程,选拔 GPT-5.3-Codex 模子;就像在 ChatGPT 里面临话样,输入指示。
条目它帮咱们下载个 X ,Codex 会自动查验可用的 Skills 来处理,接着通过 yt-dlp 器具进行下载,这个有四个多小时长,Codex 会直在对话框里自动新下载进程。
▲GIF 图经过加快处理
下载后,咱们还不错条目它索取的逐字稿,给咱们份双语版块的文档,后让它把总计进程包为个 Skill,便下次使用。
手机号码:13302071130如果中有些比较专门旨敬爱的片断,想要编著,或者是把裁出来的转成 GIF 图,在 Codex 里皆能作念到。
举例,咱们这里下载了个,然后条目它把的 5s-25s 编著出来成为个新的;收获于 GPT-5.3-Codex 的 Token 快速处理,总计过程不需要很永劫辰,反而多是取决于土产货电脑的硬件解码编码才气。
▲ GIF 图经过加快处理
或者咱们也不错平直条目它把的前 5s 转成个 GIF 文献松原钢绞线价格表,况且确保大小在 10MB 以内,帧数不错自行休养,明晰度上将宽度扫尾在 640px。
很快,咱们就能得回对应的 GIF 文献。端点,还能让它把总计转成图片,每秒 30 帧,每帧即是张图。
这些对土产货文献的平直处理,和 GPT-5.3-Codex 在 Terminal-Bench-2 测试集上的异进展,让 Codex 基本上能得志多样分娩力器具、率器具的杀青。
算作对比,一样是刚刚发布的 Claude Opus 4.6 在 Terminal-Bench 2.0 上得分是 65.4,GPT-5.3-Codex 是 77.3。
▲ 图片起原:https://x.com/neilsuperduper/status/2019486017703547309/
举例在这个文献夹中,有多张图片,咱们先是条目它左证图片内容,对这些图片文献进行重定名,并保捏文献名不外 20 个字母,不允许使用标记。
▲ GIF 图经过加快
自动修改完成后,咱们还能条目他对这些图片进行拼接,论是垂直拼接照旧水平,调用对应的器具,Codex 皆不错作念到。
和 Claude Skills 样,Codex 也能安设 Skills 市集上丰富的妙技,况且在愚弄内,就也曾提供了包括 pptx、xls、word、canvas、notion 在内的多款妙技。
回到基础的编程才气,升后的 GPT-5.3-Codex 进展也比 GPT-5.2 要好上不少。咱们平直条目它写个「逐日词」的 App。和在 ChatGPT 里面平直用 Canvas 给咱们个带不走的网页不同,Codex 能在土产货从运行,完成口头,然后使用 Vercel 或 Cloudflare 等 Skills 部署到网页上。
这里咱们选拔的理模式是 Extra High,强理模式,于是在每步操作之前,GPT-5.3-Codex 皆会商讨我下步的操作选拔,这也和 Codex 里面能平直左证任务情况,调用不同 Skills 关系,其中的头脑风暴 Skill,锚索会自动进行不停对话的模式。
后,它基本上照旧完成了我运行条目它完成的沿路,况且还能高出开导 macOS、iOS,和安卓版块。
如果咱们有现成的代码口头,也不错选拔该口头文献夹,在 Codex 中开,GPT-5.3-Codex 会分析口头存在的 Bug,况且诞生它。
在夙昔很长段时辰里,论是器具照旧模子,开导者的选其实皆是 Anthropic 的 Sonnet/Opus 模子和 Claude Code 器具。OpenAI 在编程、尤其是长代码逻辑理上的掉队,曾让不少开导者转投阵营。
GPT-5.3-Codex 的出现,即是为了废除这场争论。当前 GPT-5.3-Codex 在编程基准测试和实质进展上,不仅碾压了自的前代模子,也照实有把友商模子按在地上摩擦的前兆。它着实具备了编写、测试和理代码的才气。
作念游戏口头,是此次模子先容博客里,网站开导部分主要案例,咱们也让 GPT-5.3-Codex 作念了个绵薄的物理弹球游戏,全体的果天然莫得达到我的期待,因为我在教导词里面有说但愿这是个 RPG 的游戏,但 GPT-5.3-Codex 给我的界面照旧过于毛糙了。不外,好在照旧能玩。
咱们也在 X 上找到了些用 GPT-5.3-Codex 作念的小游戏,像这个近似玛丽的集合金币。
▲起原:https://x.com/Angaisb_/status/2019548783869325331
强中有强中手
对 Anthropic 来说,OpenAI 今天玩的这些,可能会说,这皆是咱们玩剩下的。论是代码、或者 Agent 的才气,照旧运行入部属手去作念土产货 Agent,从之前 Codex 的终局转成当前的 macOS App。
在技能的域,OpenAI 仿佛皆是随着 Claude 的脚步在走,Claude 耕代码才气,OpenAI 搞了 Sora、日报、浏览器、ChatGPT agent,皆没什么水花,于是也在代码上发力;Claude 月初出 Cowork,OpenAI 也紧接着在二月初发布 Codex App。
就和今天的密集发布样,凌晨 1:45,Claude 官发 X 出 Claude Opus 4.6,紧接着即是 OpenAI 端上 GPT-5.3-Codex。两款模子其实皆是为了给 Agent 强大的基座才气,以前是说代码/vibe coding,但当前 Agent 能作念好,基本上皆是「写代码写得好」。
Opus 4.6 天然在 SWE-Bench 上的进展以至不如 Opus 4.5,况且 Terminal-Bench 2.0 上的成绩也莫得 GPT-5.3-Codex 强,然则 Opus 破天瘠土把凹凸文长度拉到了百万 token 的窗口。而且,这些 benchmark 的进展还莫得进出许多。
Claude 说,我的 Sonnet 5 还没上来,那才是真功夫。
咱们在网上也找了些 Opus 4.6 新的测试案例,有网友说 Claude 4.6 Opus 仅仅次调用,就重构了他的总计代码库,将蓝本散乱的代码「屎山」沿路模块化,况且莫得模子能像 Opus 这么作念到。
还有网友拿 Opus 4.6 和 4.5 进行对比,让两个模子玩同款指标游戏,看谁的账户等、钞票和装备。测试博主提到,4.6 版块在初期制定政策的时辰长,然则作念出了好的政策有臆度打算,况且在后照实作念到了遥遥先。
还有网友也作念了个游戏,不外是个宝可梦的克隆版。博主提到这是他用 AI 作念出来的酷的东西。他提到,Claude Opus 4.6 念念考了 1 小时 30 分钟,使用了 11 万个 Token,况且只迭代了三次。
▲ https://x.com/chatgpt21/status/2019679978162634930
在 CLaude 官演示和早期用户的响应中,也提到了个 Opus 进展秀的案例。Opus 4.6 在天内自主关闭了 13 个 issue,issue 即口头存在的待搞定问题,并将另外 12 个 issue 准确分拨给了正确的东说念主类团队成员。
和 Kimi K2.5 的智能体蜂群样,Opus 4.6 也能管制个 50 东说念主界限组织的代码库。在 Claude Code 中,咱们不错组建 Agent Teams,召唤出总计戎行的 AI,不再是个 AI 在战争。这些AI 不错有的庄重写代码,有的庄重 Review,有的庄重测试,它们之间自主互助。
也有网友测试了 Claude Code 里面的 Agent 蜂群,提到启用蜂群之后的 Opus 4.6,速率普及 2.5 倍,况且果也好。
咱们当前的情状就跟这张图片样,天然山比山,但皆绕不出这个圈。前几个月可能是 Gemini 赚走了风头,月份来,应该是 Claude,然后看神情又要轮到 OpenAI,或者马斯克的 Grok。
好在这个循环的过程中,算作用户的咱们,能彰着嗅觉到 AI 的才气直在变强。
GPT-5.3-Codex 的 API 还莫得绽开,原因是模子太强了,会存在很大的风险,是以 OpenAI 还在谈判怎样安全地启用 API。
Claude Opus 4.6 也曾不错在 Claude 通用聊天愚弄、Claude Code、API 多种式使用,这两个算作本年外洋御三发的两款模子,至极值得试。
异日,好的劳动 Agent,让 Agent 为咱们作念事,还会是大模子新的。
相关词条:铝皮保温施工 隔热条设备 钢绞线 玻璃棉卷毡 保温护角专用胶