OpenAI正式发布GPT-5

OpenAI 已推出全新旗舰人工智能模型 GPT-5,该模型将为公司下一代 ChatGPT 提供技术支持。
于周四发布的 GPT-5 是 OpenAI 的首个 “统一” 人工智能模型,它融合了 o 系列模型的推理能力与 GPT 系列的快速响应优势。这款下一代模型标志着 ChatGPT 及其开发者 OpenAI 迈入新纪元,也彰显了 OpenAI 更宏大的野心 —— 开发更接近智能代理而非聊天的人工智能系统。
如果说 GPT-4 让人工智能聊天机器人能够对各类问题给出智能回应,那么 GPT-5 则让 ChatGPT 能够代表用户完成多种任务,例如生成软件应用、管理用户日程或创建研究简报。
借助 GPT-5,OpenAI 还致力于让 ChatGPT 更易于使用。GPT-5 配备了实时路由机制,无需用户手动选择设置,就能自主决定如何提供最佳答案 —— 无论是快速回应用户问题,还是花更多时间 “思考” 答案。

在记者简报会上,OpenAI 首席执行官山姆・奥特曼称 GPT-5 是 “世界上最出色的模型”,并表示它代表着公司在开发 “能在大多数高经济价值工作中超越人类” 的人工智能(即人工通用智能,AGI)道路上迈出了 “重要一步”。
“在历史上任何时期,像 GPT-5 这样的技术都几乎是无法想象的,” 奥特曼说。
从周四开始,GPT-5 将作为默认模型向所有 ChatGPT 免费用户开放。OpenAI 负责 ChatGPT 的副总裁尼克・特利表示,这是公司首次让免费用户接触到人工智能推理模型(此前,这类更先进的模型仅对付费用户开放)。
“这只是我为践行使命而感到兴奋的方式之一,确保这些技术真正惠及大众,” 特利在谈及这一决定时说,他提到了 OpenAI 长期以来的使命 —— 让尽可能多的人接触到先进的人工智能。
外界对 GPT-5 的期待极高,它是自 2022 年 ChatGPT 让 OpenAI 声名鹊起以来,该公司最受期待的产品发布之一。据该公司称,从那以后,ChatGPT 已成长为全球最受欢迎的消费级产品之一,每周用户超过 7 亿 —— 接近全球人口的 10%。
许多人将 GPT-5 视为人工智能整体发展的风向标,硅谷对该模型的反响可能会对大型科技公司、华尔街以及监管科技的政策制定者产生深远影响。这些利益相关方正密切关注 GPT-5 是否能像其前代产品 GPT-4 那样,在人工智能能力上实现重大飞跃,打破人们对软件功能的固有预期。
GPT-5 略胜竞争对手一筹
OpenAI 称,GPT-5 在多个领域达到了最先进水平,在关键基准测试中略优于 Anthropic、谷歌 DeepMind 和埃隆・马斯克的 xAI 等公司的顶尖人工智能模型。不过,在其他一些领域,GPT-5 的表现略逊于前沿人工智能模型。
该公司表示,GPT-5 在编程领域展现出前沿水平;奥特曼称,该模型尤其擅长按需生成完整的软件应用,也就是人们所说的 “氛围编程”。
在 SWE-bench Verified(一项基于 GitHub 真实编程任务的测试)中,GPT-5 首次尝试的得分达到 74.9%。这意味着 GPT-5 略优于 Anthropic 最新的 Claude Opus 4.1 模型(得分 74.5%)和谷歌 DeepMind 的 Gemini 2.5 Pro 模型(得分 59.6%)。
在 “人类终极考试”(一项衡量人工智能模型在数学、人文和自然科学领域表现的高难度测试)中,具备扩展推理能力的 GPT-5 版本(GPT-5 Pro)在使用工具的情况下得分 42%。这略低于 xAI 的 Grok 4 Heavy 模型,后者在该测试中得分 44.4%。

OpenAI 表示,GPT-5 在回答健康相关问题方面表现更出色。在衡量人工智能模型健康领域回应准确性的测试 “HealthBench Hard Hallucinations” 中,OpenAI 称 GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的得分分别为 12.9% 和 15.8%。
尽管人工智能聊天机器人并非医疗专业人员,但数百万用户正借助它们获取健康建议。针对这一现象,该公司表示,GPT-5 会更主动地提示潜在的健康问题,并帮助用户解读医疗检查结果。
此外,OpenAI 称,在创意设计、写作等更难衡量的主观领域,GPT-5 也优于其他人工智能模型。特利表示,在创意任务中,GPT-5 的回应更自然,且展现出 “更好的品味”。
“这款模型的‘氛围’真的很棒,” 特利说。
GPT-5 也比 OpenAI 之前的模型更准确,该公司称,与 o 系列模型相比,GPT-5 的幻觉现象(即人工智能模型编造信息的倾向)大幅减少。此前,在 OpenAI 最新的人工智能推理模型(如 o3)中,幻觉问题似乎愈发严重,而该公司此前表示尚未完全弄清楚原因。
在对 ChatGPT 提示词的回应中,OpenAI 发现 GPT-5(启用思考功能时)产生幻觉并给出错误信息的概率为 4.8%。这较 o3 和 GPT-4o 有显著降低,后两者在测试中的幻觉率分别为 22% 和 20.6%。
在衡量人工智能模型完成模拟在线任务的代理能力基准测试 Tau-bench 中,GPT-5 的表现好坏参半。在测试人工智能浏览航空公司网站能力的部分,GPT-5 得分 63.5%,略低于 o3 模型的 64.8%。在测试人工智能浏览零售网站能力的另一部分,GPT-5 得分 81.1%,低于 Claude Opus 4.1 模型的 82.4%。
OpenAI 还表示,GPT-5 比其之前的模型更安全。尽管人工智能推理模型偶尔会表现出针对人类的谋划倾向,或为了达成自身目标而说谎,但 OpenAI 发现 GPT-5 的欺骗率低于其他模型。
OpenAI 安全研究负责人亚历克斯・比图尔表示,降低欺骗性不仅提高了 GPT-5 的安全性,还改善了用户体验,打造出一个 “在用户可信赖的层面上更透明、更诚实” 的模型。
比图尔还指出,GPT-5 能更好地区分试图滥用 ChatGPT 的恶意用户和提出无害请求的用户。这使得 GPT-5 能够拒绝更多不安全的问题,同时减少对寻求无害信息用户的拒绝次数。
为消费者和开发者打造的升级功能
随着 GPT-5 的发布,ChatGPT 迎来了多项用户体验升级。用户现在可以在 ChatGPT 的设置中选择四种新的人格:愤世嫉俗型、机器人型、倾听者型和书呆子型。该公司表示,这些人格将自动调整 ChatGPT 的回应方式,无需用户专门要求模型以特定方式回应。
每月支付 20 美元的 ChatGPT Plus 订阅用户比免费用户拥有更高的 GPT-5 使用限额。而每月支付 200 美元的 Pro 订阅用户可无限制使用 GPT-5,并能访问增强版的 GPT-5 Pro—— 该版本使用额外的计算资源生成更优质的答案。采用 OpenAI Team、Edu 和企业版计划的机构将在下周获得 GPT-5 作为默认模型。
对于开发者,GPT-5 将以三种规格通过 OpenAI 的 API 开放 ——gpt-5、gpt-5-mini 和 gpt-5-nano,它们在任务 “推理” 上花费的时间长短不同。开发者现在还可以通过 OpenAI API 控制回应的详细程度,决定人工智能模型的回应篇幅长短。
GPT-5 基础模型对开发者的收费为:每百万输入令牌 1.25 美元(约合 75 万个单词,比整套《指环王》系列的字数还多),每百万输出令牌 10 美元。
GPT-5 的发布之前,OpenAI 度过了忙碌的一周。该公司发布了开源权重推理模型 gpt-oss,开发者和企业可免费下载,且运行成本极低。这款开源模型的能力几乎与 OpenAI 之前的顶级模型 o3 和 o4-mini 相当,但 GPT-5 在编程等部分领域树立了新的前沿性能标准。
不过,在多个领域,GPT-5 似乎与其他前沿人工智能模型大致相当。当然,基准测试只能反映人工智能模型的部分表现,开发者将如何在现实世界中使用 GPT-5,以及该模型是否真的超越竞争对手,仍有待观察。
- • 广西公需科目继续教育登录入口:提升自我,助力职业发展
- • 《言情小说库中的璀璨明珠:那些好看的港台言情小说推荐》
- • 特朗普称将对芯片征收约100%的关税
- • 华硕V5000:高性能与时尚兼备的轻薄笔记本
- • 倾莲池博客:心灵的栖息地,文字的花园
- • 末班车后,胶囊旅馆无修版的温馨角落
- • 英媒:英国提议向乌派遣6.4万士兵,欧洲各国表示不可能,“连2.5万人都难凑齐”
- • 用“六一”的方式打开天津
- • 超28省优化防疫措施,共筑疫情防控新防线
- • 锗价驱动2024年业绩暴增,云南锗业如何破解现金流负增长困局?
- • 余承东首次回应“开车睡觉”事件:没有睡觉,低头看了下手机
- • 美国恶劣天气已造成至少28人死亡
- • 欧盟称正调查马斯克旗下X公司企业架构
- • 以称伊朗弹道导弹发射能力“已被严重削弱”
- • 野生紫苏:大自然的绿色瑰宝,养生保健的佳品
- • 中微半导赴港上市:营收曾暴跌42%净利润过山车,毛利率异常起伏最高69%最低17%,前五大供应商采购额占比84%
- • 爆米花AV:揭秘网络中的“甜蜜陷阱”
- • 荣盛房地产发展股份有限公司官网:探索品质生活,共创美好未来
- • 美国经济三年来首次萎缩 因特朗普发动贸易战扰乱企业经营
- • 重生的TA | 关税博弈里的检测厂,如何造出石化业的“香饽饽”?
- • 常慧法师:智慧之光,照亮人生道路
- • 国常会:进一步优化现有政策 更大力度推动房地产市场止跌回稳
- • 《笑到肚子疼!这些搞笑污段子,保证能笑死你!》
- • 《围棋人机对弈免费版:智能棋艺的普及与体验之旅》
- • 对冲基金大鳄阿克曼呼吁马斯克与特朗普和解,马斯克回应
- • 日本央行按兵不动,但缩减购债计划!全球局势动荡下,植田和男如何破局?
- • 从时尚品牌到产业全景式创新平台,SHEIN如何持续进化?
- • 四部门:开展军队文职人员考试培训专项整治
- • 美国贸易代表办公室致函谈判国 提醒注意关税暂停期结束时间
- • 天津城建大学研究生院官网:探索学术殿堂,助力未来梦想
- • 专访|美国资深外交官董云裳:忧虑特朗普关税的影响,“外交”已束之高阁
- • 《天谴之心:一部精校之作,揭示人性深处的善恶较量》
- • 美国阿拉斯加地震引发局地海啸,我国沿岸不受影响
- • 美国债市:国债收益率进一步走高 美国ISM服务业报告表现强劲
- • 国际金融协会警告:美国债务飙升不仅危及自身,更可能引发全球市场危机
- • 中国首座乐高乐园®正式开园,开启国际IP亲子主题乐园创想之旅
- • 周三热门中概股涨跌不一 富途控股涨9.09%,阿里巴巴跌3.85%
- • 迦太基帝国的兴衰:地中海世界的璀璨明珠
- • 美国洛杉矶一车辆冲入人群,造成至少28人受伤
- • 国际观察|翻番的钢铝关税,倍增的反制和反噬
- • 2021中美谈判:挑战与机遇并存
- • 小摩:予港交所“中性”评级 目标价340港元
- • 四水同治:我国水资源治理的新理念与实践
- • 界面调查|铁路穿村而过:一个湘西村庄与17起火车撞人事故
- • 宏明电子闯关创业板:业绩连续两年下滑,IPO前“突击分红”2.8亿被质疑
- • 重庆九龙坡一摩托车临时停放点发生火灾:已扑灭,无伤亡
- • 山西一载12人车辆失联,工作人员:都是外出务工人员
- • 巴菲特股东大会十大金句:未来五年内可能有投资机会,快乐的人活得更久
- • 高考报志愿网站登录贵州:便捷通道助力学子梦想起航
- • 为中国人民谋幸福:新时代的使命与担当
- • 上海中考成绩揭晓:学子们展现青春风采,未来可期
- • 清华大学刘培林谈我国制造业发展快速的原因
- • 男婴离世家长获赔88万,律师拿走55万代理费?家长称上当
- • 《GTA5女鬼:游戏中的神秘传说与玩家探索之旅》
- • 王励勤妻子照片:揭开乒乓球冠军背后的温馨故事
- • 《惊雷响彻,这通天修为:探寻武侠世界中的神秘力量》
- • 富士康或参与竞购新加坡芯片封装测试UTAC 交易估值约30亿美元
- • 安庆疫情最新消息:今天新增一例,防疫措施再升级
- • 17052公里时!“最狠”超速罚单引热议,官方回应
- • 【独家】爱美客回应与江苏吴中“童颜针”争夺战来龙去脉
- • 美团闪购加速“开啃”运动鞋服等低频品类
- • “排污许可信息公开系统:构建透明环保新格局”
- • 符号互动论:揭示人类沟通与行为背后的深层逻辑
- • 揭秘4399功夫派账号密码:安全与便捷的完美结合
- • 美国司法部调查CLO市场在Libor转换期间的合谋行为
- • 炒外汇开户流程详解:轻松开启您的外汇投资之旅
- • 同道伟业携手中乙直播,共绘足球新篇章
- • 美白补水护肤品哪个牌子好?揭秘市场上最受欢迎的品牌!
- • 印度国防部批准五代战机研发项目
- • 转院手续:确保患者顺利过渡的桥梁
- • 意大利语中的“我爱你”:跨越国界的深情表达
- • 香樟树:绿色宝库中的瑰宝
- • 《课件模板下载:轻松打造个性化教学资源,提升教学效果!》
- • 甲级战犯:二战历史的阴影与反思
- • 广西壮族自治区政府主席蓝天立任上被查,系今年第4个正部级“老虎”
- • 一男子进入兵马俑三号坑,秦陵博物院:兵马俑受损等情况正在调查中
- • 殷保华新浪博客最新动态:揭秘股市大师的投资智慧
- • 广发科技先锋混合基金经理:引领科技投资新风尚
- • 穆迪下调美国评级后 投资者等待又一个 "周一震荡"
- • 中国邮政打假:部分电商及直播平台销售假冒邮资票品
- • 动力霸主:引领未来能源变革的先锋力量
- • “企业报销管理:提升效率与透明度的关键”
- • 昨夜今晨国际财经热点一览_2025年5月6日_财经新闻
- • 假借:语言游戏中的巧妙运用
本文 快租网 原创,转载保留链接!网址:https://wap.kuaizu.me/post/25020.html