2025 年 7 月 17 日,OpenAI 正式发布了全新的智能体功能ChatGPT Agent,标志着 AI 助手从“对话型”迈向“执行型”的重要一步。
🧠 核心亮点:三合一智能体,赋能工作与生活
- 智能任务执行:无论是撰写研究报告、制作幻灯片,还是在线购物、订餐预约,Agent 都能自主完成。
- 深度整合工作流:支持连接 Gmail、GitHub 等第三方应用,深度嵌入用户真实工作流。
- 实时可视化操作:执行过程中,屏幕上的语音播报会实时展示 Agent 的具体操作流程,用户可随时中断并接管浏览器操作,确保任务始终与目标保持一致。
- 任务中断与修改:在执行过程中,用户可随时中断任务,修改指令,甚至手动接管操作。
- 跨平台支持:桌面端、手机端均可使用,任务完成后还将自动推送结果通知。
⚙️ 技术架构:强化学习驱动的多模态智能体
ChatGPT Agent 是通过强化学习在复杂任务中训练出来的,结合了 Operator 提供的网页交互能力、Deep Research 的信息整合与分析能力,以及 ChatGPT 本体的自然语言理解与智能推理能力,形成了一个完整的执行系统。
📊 性能表现:刷新基准测试纪录
在跨学科专家级任务基准测试 Humanity’s Last Exam(HLE)中,ChatGPT Agent 以 41.6 的 pass@1 得分刷新纪录,启用并行执行策略后再提升至 44.4。在 FrontierMath 的难题中,其准确率达到 27.4%,显著领先此前模型。
📱 如何使用 ChatGPT Agent?
在 ChatGPT 编辑器中开启“智能体模式”,即可使用。这一模式在桌面与移动端均适用,完成任务后自动推送通知。
🔮 展望未来:AI 助手的“自主执行”时代
ChatGPT Agent 的发布,标志着 AI 助手从“对话型”迈向“执行型”的重要一步,为用户带来了更智能、更便捷的体验。
🧭 其他 AI 工具动态速览
Mistral AI 推出 Le Chat 升级版
Mistral AI 发布升级版 Le Chat,新增深度研究模式、语音模式(基于 Voxtral 模型实现语音输入)、原生多语言推理功能、项目管理功能和高级图像编辑功能,全面对标 ChatGPT。
DecartAI 发布实时视频生成模型 MirageLSD
初创公司 DecartAI 推出了全球首个实时视频生成模型 MirageLSD:支持将摄像头画面转化为其他风格,24FPS 稳定运行,延迟低于 40 毫秒,有望革新游戏体验和内容创作方式。
AISheeP商城