AI能力新高度!OpenAI发布ChatGPT智能体:能自主选择工具完成任务
创始人
2025-07-18 20:01:11

ChatGPT可以自主调用电脑资源执行任务了。

当地时间7月17日,人工智能(AI)巨头OpenAI推出ChatGPT智能体(Agent)系统,OpenAI CEO山姆·奥特曼(Sam Altman)和四位负责人进行了25分钟的直播。

据介绍,这是一套融合Operator远程浏览器执行能力、Deep Research网络信息整合技术以及ChatGPT对话优势的统一智能体平台,“可以思考和行动,能够主动从代理技能工具箱中进行选择,使用自己的计算机为您完成任务”。

奥特曼表示,智能体代表了AI系统能力的新高度。

此前,Operator和Deep Research各有优势:Operator可以在网页上处理内容,而Deep Research则擅长分析和汇总信息。但Operator无法深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需要用户身份验证的内容。此次,OpenAI直接将两者的优势进行了结合。

ChatGPT在Agent模式中会使用自己的“虚拟电脑”执行任务,基于用户指令处理复杂的工作,用户可以主动与网站互动,或在同一聊天中直接从对话过渡到直接请求操作。

在发布会上,OpenAI演示了用ChatGPT Agent同时进行买西装、做贴纸、订酒店等任务,Agent使用数秒启动虚拟电脑后便会询问用户明确需求,再进行衣服的挑选,Agent会滑动网页、点开商品详情,并留下相应的建议文字。此外,Agent也可以代替用户进行下单操作。

在“虚拟电脑”中,即使ChatGPT使用多种工具,也能保留任务所需的上下文,模型可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,通过在终端中运行命令进行操作,然后在可视化浏览器中查看输出。

同时,ChatGPT在执行重要操作之前会请求权限,用户可以随时中断、控制浏览器或停止任务。用户也可以安排已完成的任务自动重复,比如每周一早上生成每周报告。

在“人类最后一次考试”评估中,ChatGPT agent模型的SOTA(State of the arts,领域内最高水准)得分达到了41.6,当采用简单的并行部署策略(一次最多运行八次尝试,并选择自评置信度最高的一次)进行扩展时,得分提升至44.4。

此外,在FrontierMath等基准测试中,ChatGPT Agent的准确率也远超之前的模型。

Pro、Plus和Team用户可以使用Agent模式。企业版和教育版用户将在未来几周内获得访问权限。目前Pro用户每月有400次使用次数,其他付费用户每月有40次使用次数,也可以付费获得更多使用量。

相关内容

热门资讯

对门邻居装了3个摄像头,“能拍... 邻居家的围墙上 安装了3个可360度旋转的摄像头 每天对着她家院子无死角拍摄 甚至自家大门、客...
伊朗大批退役军人和两伊战争老兵... 总台记者获悉,伊朗军队3月4日发布第10号公告表示,鉴于美以对伊朗的袭击,大批退役军人和两伊战争老兵...
德防长:德国军队不会参与针对伊... 当地时间4日,德国国防部长皮斯托里乌斯在联邦议院发表讲话时称,德国不是交战方,不会参加美国和以色列针...
伊朗开展第18轮攻击 当地时间4日晚,伊朗伊斯兰革命卫队称,“真实承诺4”第十八轮行动已开始。(央视) 来源:中国新闻网
伊朗关闭“世界油阀”,油价会冲... 新京报记者 杜晓彤 董怡楠 设计 师春雷 编辑 王进雨 校对 柳宝庆 “我们不会允许一滴石油从该地区...