OpenAI近日宣布,其開發中的AI模型在素有「數學界奧運」之稱的國際數學奧林匹亞競賽(International Math Olympiad, IMO)中,展現出等同金牌得主的解題能力,為AI在複雜推理能力上帶來重大突破。
1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO). pic.twitter.com/SG3k6EknaC
— Alexander Wei (@alexwei_) July 19, 2025
實驗性模型成功解答5道題
據科技新聞網站Engadget報導,OpenAI研究科學家亞歷山大(Alexander Wei)於19日在社交平台X上發文指出,這項成就實現了AI領域一項「長期以來的巨大挑戰」。他透露,該公司一款尚未發布的實驗性模型,在IMO競賽六道題目中成功解答5道,於總分42分中獲得35分。
OpenAI reasoning model won a GOLD MEDAL 🥇 on the 2025 International Mathematical Olympiad.
— Diego | AI 🚀 - e/acc (@diegocabezas01) July 19, 2025
We thought we were years away from this moment!
Is this GPT5? https://t.co/HiUZzflxIL pic.twitter.com/12msOzLkMm
奧數賽事難度極高 僅10%能獲金牌
IMO匯集全球頂尖年輕數學人才,挑戰極具深度與廣度的代數和微積分預備知識問題。儘管題目看似簡潔,卻往往需要高度的創造性思維才能取得滿分。以今年的賽事為例,全球630名參賽者中,僅有約10%(67人)能獲得金牌 。
接近人類推理方式 精準處理複雜數學問題
傳統上,人工智能在處理龐大數據集和重複性任務方面表現卓越,但在面對需要高度創造力或複雜決策的問題時,往往難以展現同等水準。然而,OpenAI的最新研究成果表明,其模型已能以接近人類的推理方式,精準地處理國際奧數等級的複雜數學問題。
OpenAI開發模型解5高難度數學題奪奧賽金牌 ,打敗9成參賽。AP圖片
模型可構建邏輯論證
亞歷山大強調,透過這項進展凸顯「我們獲得了一個能夠像人類數學家一樣,構建精巧且邏輯嚴密的論證模型」。這也意味著AI不僅能執行計算,更能理解並建構複雜的數學證明,這對於科學研究與工程領域的自動化將產生深遠影響。
未來產品數月後推出
儘管此項技術的突破令人振奮,亞歷山大與OpenAI執行長奧特曼(Sam Altman)均表示,具備此等頂尖數學解題能力的產品,預計還需數個月才會正式發布。這也暗示著,即將推出的GPT-5模型,會在前一代基礎上大幅精進。
OpenAI開發模型解5高難度數學題奪奧賽金牌,打敗9成參賽者。X平台圖片@alexwei_