
拉响“红警报”应对谷歌竞争后通辽隔热条设备,当地时间12月11日,OpenAI出了GPT-5.2,包含GPT-5.2 Instant、Thinking和Pro模式,此时距离OpenAI更新GPT-5.1只过去了一个月。
此次发布GPT-5.2,被外界视为OpenAI应对谷歌挑战的一次反击。上个月谷歌发布Gemini 3后,在硅谷掀起一场AI权力的重新分配,OpenAI作为大模型霸主的地位受到挑战。
不同于GPT-5.1着重强调具有“情绪价值”、能与人愉快交谈,此次应对挑战,OpenAI拿出了更多“真枪实弹”。GPT-5.2出了更多智能上的更新,也放出了基准测试的分数。可以看到一些基准测试分数提升明显。
例如,在知识型工作任务GDPval测试中,GPT-5.2Thinking的分数为70.9%,明显过GPT-5.1的38.8%,在抽象理ARC-AGI-2基准测试中,GPT-5.2Thinking的分数为52.9%,明显过GPT-5.1的17.6%。另一些基准测试分数也有提升,在软件工程SWE-Bench Pro、科学问题GPQA Diamond、科学图表类问题CharXiv理、数学竞赛HMMT测试中,GPT-5.2Thinking的分数为55.6%、92.4%、88.7%、99.4%,GPT-5.1为50.8%、88.1%、80.3%、96.3%。
基于这些能力提升,OpenAI称为业知识型工作打造的GPT-5.2是公司至今强的模型,“GPT-5.2在众多基准测试中都刷新了行业水平,例如GDPval测试中,这款模型在涵盖44个职业的明确知识型工作任务中表现过了行业家。”
谷歌发布的Gemini 3 Pro此前在基准测试榜单中“屠榜”通辽隔热条设备,OpenAI此次在基准测试榜单中终于扳回一局。
据此前谷歌放出的数据,在ARC-AGI-2测试中,Gemini 3 Pro分数为31.1%,远GPT-5.1的17.6%,GPQA Diamond测试中,Gemini 3 Pro分数为91.9%,过GPT-5.1的88.1%,这种明显的能力提升当时引来业内人士预言“未来6个月内很难有公司能越这一成绩”。此次GPT-5.2在上述两项基准测试中得分终于过了Gemini 3 Pro。不过,记者留意到,当时谷歌放出的一些分数明显过OpenAI的基准测试,例如Humanity’s Last Exam,此次GPT-5.2并未放出。
OpenAI此次也强调了新模型在业工作中的可用,称基准测试得分体现了GPT-5.2在制作演示文稿、电子表格等方面的表现优于或与业人士持平,生成的电子表格和幻灯片在复杂度和格式呈现上相比前一代有明显提升。不过,用户要使用新的电子表格和演示文稿功能,需要订阅付费套餐。长上下文能力使新模型能处理报告、同、研究论文等文件。而在编码任务中,GPT-5.2能更可靠地调试生产环境代码、以更少的人工干预完成修复交付。
文安县建仓机械厂OpenAI演示了一些编码方面的案例,例如,只需要一个提示,GPT-5.2就能生成一个海浪模拟器、一个节日贺卡生成器。其中,海浪模拟器可以拉动数值,改变风速和海浪高度。OpenAI还强调了GPT-5.2 Thinking的幻觉率低于前一代,在一组去标识的查询中,新模型错误回答的频率比GPT-5.1 Thinking减少了38%。OpenAI称,这意味着在写作、研究、分析和决策中模型犯的错误更少,GPT-5.2 Thinking在图表理和软件界面理解方面的错误率减少了大约一半。此外,OpenAI称,塑料挤出设备GPT-5.2 Pro和GPT-5.2 Thinking还是目前有助于加快科研进展的模型。
GPT-5.2Instant、Thinking和Pro周四在ChatGPT中陆续出,付费套餐用户将能率先体验。不过,OpenAI应对谷歌等竞争而拉响的“红警报”,并未随着GPT-5.2的发布而解除。
此前OpenAI CEO山姆·奥尔特曼(Sam Altman)在内部备忘录中承认通辽隔热条设备,随着谷歌等竞争对手的快速进步,公司正面临“氛围紧张”和“经济逆风”的双重挑战。
此次OpenAI则表示,拉响“红警报”是为了集中资源,是一种明确优先级的方式,公司确实增加了更多与ChatGPT相关的资源。奥尔特曼表示,谷歌发布的Gemini 3对公司的一些指标的影响,比原本预计的更小,但当竞争对手的威胁出现时,应该注并迅速应对,OpenAI预计在明年1月之前结束“红警报”状态。
GPT-5.2将不是OpenAI应对竞争抛出的唯一产品,奥尔特曼在社交媒体上表示,下周OpenAI还将送出一些“小小的圣诞礼物”。
美国金鹰房产投资公司执行伙人陈跃武对一财经记者表示,近期各业机构进行了新一轮数据更新,可以看到美国楼市降温,正进入2022年以来2个调整期,但此轮调整较为温和,同时美国房产卖家拥有丰厚净资产,没有被迫卖房的压力。


值得注意的是,特朗普此前已证实,他将在当地时间17日于白宫与来访的乌克兰总统泽连斯基会面。16日,已抵达美国的泽连斯基表示,希望中东和平势头有助于结束乌克兰危机。进入10月以来,泽连斯基已多次与特朗普进行通话。
当被现场记者问到“这座拱门是为谁建造的”,特朗普指着自己说:“我。”
根据中国摩托车商会对海关数据的统计分析,2025年1-8月,我国摩托车整车出口量为1204.95万辆,较去年同期增长30.38%,出口额为75.33亿美元,较去年同期增长34.63%。其中,拉丁美洲出口多,出口量为437.61万辆,同比增长17.72%,出口额为26.56亿美元,同比增长26.33%。非洲出口涨幅大,出口量为381.26万辆,同比增长72.26%,出口额为20.15亿美元,同比增长76.86%。
举报 一财经广告作,请点击这里此内容为一财经原创,著作权归一财经所有。未经一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。一财经保留追究侵权者法律责任的权利。如需获得授权请联系一财经版权部:banquan@yicai.com 文章作者郑栩彤
相关阅读 连姥姥都在问DeepSeek!一位AI六小龙掌门的反思与进击明年大模型公司或许会更少,中国做AI大的优势是人才。
263 昨天 20:06 AI周报 | DeepSeek开源奥数金牌水平模型;前OpenAI 联创称规模扩展时代已终结英伟达反击“大空头”言论;百度新设两大AI部门。
227 11-30 08:31 谷歌成“新王”、OpenAI遭逆风,硅谷AI圈洗牌AI座次的重排正对资本市场产生深远影响。
7 296 11-26 10:01 新模型“屠榜”,对话谷歌团队:AI“新旗手”如何诞生从追赶到先,谷歌让整个AI圈“炸了”。
317 11-19 11:44 正面硬刚谷歌和OpenAI!马斯克xAI发布Grok 4.1,智商情商双在线一个重要的更新方向是情感智能通辽隔热条设备。
229 11-18 13:20 一财热 点击关闭