打造下一代操作系统,OpenAI的野心藏不住了!

首页    新闻动态    打造下一代操作系统,OpenAI的野心藏不住了!

转自 每日商业必读 ,本文仅用于学术分享,如有侵权可联系删除

 

 

“它不是回答问题的存在,而是自己改变世界的存在。”

最近,OpenAI首席执行官山姆·奥特曼在2025开发者日上的这句话,点燃了旧金山梅森港会场。

面对全球开发者,他官宣了四大重磅更新,彻底暴露了OpenAI的野心——要把ChatGPT打造成未来的操作系统。

ChatGPT不再满足于做一个聊天机器人,它要成为每个人数字生活的“默认界面”,正如曾经的Windows桌面。

 

01

野心膨胀

 

OpenAI的野心,藏在惊人的增长数据里。奥特曼宣布,OpenAI开发者规模已从200万暴增至400万,短短两年翻了一倍。

更惊人的是,ChatGPT周活用户从1亿猛增到8亿,翻了8倍。API调用量更是呈现爆炸式增长,每分钟处理的token从3亿飙升至60亿,增长20倍。

这些数字不仅代表成功,更揭示了AI正在成为新的技术基础设施。

OpenAI应用CEO Fidji Simo直言不讳地表示,新功能将“无法想象”,非常期待开发者打造的应用。OpenAI的目标是让ChatGPT成为每个人的“默认界面”,就像曾经Windows是每个人的数字世界入口一样。

最重磅的炸弹是Apps SDK的发布,这堪称ChatGPT迈向操作系统的关键一步。

 

通过Apps SDK,开发者可以在ChatGPT内构建原生应用,用户无需跳转即可直接使用完整应用功能。这意味着,ChatGPT正在进化成一个全新的“APP Store”。

现场演示惊艳四座。OpenAI软件工程师Alexi展示了一系列场景:

只需输入“Coursera”,ChatGPT就能自动识别并调用该应用,直接在聊天窗口中嵌入课程视频,用户甚至能随时提问关于当前播放内容的问题。

呼唤“Canva”设计海报,描述需求后,Canva应用直接在对话中生成设计选项,并可进一步迭代成完整的融资演讲稿。

查询房价时,Zillow在对话中嵌入互动地图,支持全屏浏览和筛选,还能结合ChatGPT的搜索工具查询房产周边信息。

首批亮相的应用包括Booking.com、Canva、Coursera、Expedia、Figma、Spotify和Zillow。Apps SDK建立在MCP这一开放标准之上,开发者对后端逻辑和前端UI拥有完全控制权。

 

02

8分钟搭建复杂Agent

 

OpenAI推出的AgentKit,让构建AI智能体像搭积木一样简单。

AgentKit是一套面向开发者和企业的完整工具集,用于构建、部署和优化智能体。它包含三个核心组件:

Agent Builder——可视化画布,通过拖拽方式设计工作流;

Connector Registry——集中管理数据与工具的连接;

ChatKit——嵌入定制聊天界面的工具包。

OpenAI平台体验部门的Christina Huang现场挑战极限,仅用8分钟就构建了一个完整的问答智能体“Ask Froge”。

 

她首先拖入分类器节点判断用户查询类型,然后创建两个专用智能体节点,分别上传会议信息文档和通用信息文件,甚至设置了智能体的角色风格——像一只名为Froge的青蛙一样说话。

接着,她使用Widget Builder设计了精美的日程卡片,添加了Guardrail节点保护个人信息,最后将智能体部署到网站。全程没有编写一行代码。

OpenAI还提供了评估智能体能力的Eval指标,通过数据集、跟踪评分、自动化提示和第三方模型支持来评估智能体的能力。

 

03

开发革命

 

奥特曼宣布,Codex结束预览,正式进入通用可用阶段。这个编程助手正在改变软件开发的本质。

自今年初发布以来,Codex的每日消息量增长10倍,处理了超40万亿token。在OpenAI内部,Codex现在负责每周70%的PR。

思科在内部部署Codex后,代码审查速度提升50%,项目平均周期从数周缩短至数天。

 

现场演示更令人惊叹。OpenAI开发者负责人Romain Huet进行了“舞台灯光控制器”的实时互动演示。

Codex不仅快速生成功能齐全的界面,还解析了相机所需的UDP数据包,甚至发现了特定型号相机所需的特殊头部信息。

更令人惊讶的是,他通过Codex的Realtime API和智能体语音,用语音指令控制会场灯光系统,只需说一句“将灯光聚焦到观众席”,Codex便瞬间点亮观众席。

全新的Slack集成让用户像与同事交流一样,在团队频道中直接向Codex分配任务。Codex SDK则允许将智能体嵌入用户自己的工作流、工具或应用中。

OpenAI还发布了三大API更新——GPT-5 Pro、gpt-realtime-mini和Sora 2。

GPT-5 Pro是OpenAI迄今最智能、最有深度的模型,在指令遵循方面能力大幅提升。

奥特曼解释说:“GPT-5 Pro将成为开发者思考的合作伙伴,现在不是人写代码,而是AI一起思考写出来的时代。”

gpt-realtime-mini是两个月前高级语音模型的缩小版,成本降低70%,但语音质量和性能保持不变。

奥特曼强调:“就我个人而言,我认为语音将成为人们与AI交互的主要方式之一。而这次发布正是迈向这一现实的一大步。”

Sora 2的API也正式上线,视频长度、宽高比、分辨率全程可控。Sora 2首次实现音画同步,直出背景和环境音效。

 

玩具企业美泰是最先测试Sora 2 API的合作伙伴。设计师输入手绘的画后,就会转换成涂有Sora 2颜色和材质的3D产品试行方案,从构思到视觉化所需的时间从“几周缩短到了几分钟”。

 

04

生态愿景

 

OpenAI的战略转型已经清晰可见——从提供AI工具到构建完整生态。

AgentKit、Apps SDK和Codex共同构成了一套完整的生态系统。开发者可以轻松构建应用和智能体,并在ChatGPT平台上面向全球数亿用户分发。

OpenAI承诺,今年晚些时候将推出应用目录,用户可浏览、搜索、发现应用。符合基本标准的应用都将被收录,而优秀应用将获得更显著的推荐位置,甚至在对话中被主动建议给用户。

OpenAI还在测试新的商业协议,支持多种变现方式,包括新的Agentic Commerce Protocol,允许在ChatGPT内部实现即时结账。

这一切都指向一个方向:ChatGPT不再仅仅是聊天工具,而是正在成为像Windows、iOS一样的平台级存在。

奥特曼在舞台上的自信源于实实在在的数据支撑。每分钟60亿token的API消耗,证明AI已不再是概念,而是真正成为了全球开发者的技术基础设施。

从编码到设计,从商业到艺术,任何有想法的人都能为自己、家人、社区构建应用。操作系统的大门已被撞开,ChatGPT正站在门口,企图成为未来数字世界的终极入口。

2025/12/03 10:08
Browsing amount:0
Collection