OpenAI發(fā)布GPT-5.2 錯誤減少30% 表現(xiàn)超越專業(yè)人士
12月12日,據(jù)外媒報道,在推出GPT-5.1僅一個月后,OpenAI今日正式發(fā)布了下一代模型系列GPT-5.2,該系列將為其廣受歡迎的聊天機(jī)器人提供動力。官方稱,GPT-5.2是迄今為止“面向?qū)I(yè)知識工作最強(qiáng)大的模型系列”。
GPT-5.2旨在幫助人們更快地完成更多工作。它在創(chuàng)建電子表格、制作演示文稿、編寫代碼、圖像感知、理解長上下文、使用工具以及完成多步驟項目方面表現(xiàn)更佳。新模型在通用智能、長上下文理解、智能體工具調(diào)用和視覺能力上均有改進(jìn),非常適合現(xiàn)實(shí)世界的專業(yè)應(yīng)用。
具體而言,GPT-5.2的“思考”版本比GPT-5.1的“思考”版本產(chǎn)生幻覺更少,包含錯誤的回復(fù)減少了30%。其長上下文處理能力顯著提升,能夠駕馭報告、合同、論文及多文件項目,在數(shù)十萬tokens的范圍內(nèi)保持準(zhǔn)確性。同時,它在解讀截圖、技術(shù)圖表和可視化報告方面也更為出色。
OpenAI表示,在涵蓋44種職業(yè)的知識工作任務(wù)測試中,GPT-5.2的表現(xiàn)超越了行業(yè)專業(yè)人士,在GDPval測試中獲得了70.9%的分?jǐn)?shù)。相比之下,GPT-5.1在該基準(zhǔn)測試中的得分為38.8%。這使得GPT-5.2成為OpenAI首個達(dá)到或超越人類專家水平的模型。
對于ChatGPT用戶而言,GPT-5.2將顯得更有條理、更可靠,并具有更溫暖、更對話式的語調(diào)。OpenAI介紹,GPT-5.2 Instant是日常工作的得力助手,在信息搜索、步驟指南、技術(shù)寫作和翻譯方面有改進(jìn);GPT-5.2 Thinking適用于更復(fù)雜的任務(wù),如總結(jié)長文檔、編程、回答關(guān)于上傳文件的問題以及規(guī)劃決策;而GPT-5.2 Pro則專為那些值得等待更高質(zhì)量答案的難題設(shè)計。
GPT-5.2 Instant、Thinking和Pro版本即日起向付費(fèi)ChatGPT用戶推出,其API也將面向所有開發(fā)者開放。
此次新一代模型的發(fā)布,距離OpenAI首席執(zhí)行官山姆·奧特曼宣布“代碼紅色”狀態(tài)僅過去一周。他當(dāng)時要求員工專注于改進(jìn)ChatGPT,以確保其不會落后于谷歌的Gemini和Anthropic的Claude等競爭對手。GPT-5.2的迅速面世,無疑表明了OpenAI在激烈AI競賽中保持領(lǐng)先地位的決心。


