Skip to Content Facebook Feature Image

OpenAI發佈新AI模型o1 整體思考自我修正 答奧數題正確率超8成

大視野

OpenAI發佈新AI模型o1 整體思考自我修正 答奧數題正確率超8成
大視野

大視野

OpenAI發佈新AI模型o1 整體思考自我修正 答奧數題正確率超8成

2024年09月16日 11:20 最後更新:11:42

OpenAI 發表名為「o1」的最新AI模型,會運用更多時間思考,還能夠認識錯誤並修正答案,就像真人一樣。

新版旨在回答更複雜問題

綜合外媒報道,OpenAI推出新型人工智能模型o1-preview,是該公司計劃中「推理」模型系列的首款產品。o1模型旨在回答更複雜的問題,且速度快於人類。同時發布的還有較小型、更經濟實惠的o1-mini版本。

不再猜測改為整體盤算

新的模型名稱不僅重新回到「1」開始,而且也拿掉「GPT」,意味著 o1 和 GPT 系列採取了不同的策略,不再是靠統計預測的方式,去「猜」下一個字應該是什麼,而是會整體的考慮問題和答案的邏輯性。

數學考試答對問題83%

OpenAI研究主管特沃雷克 ( Jerry Tworek ) 表示,o1「使用了全新的優化演算法和特別為其量身打造的訓練數據集」。這種新方法使用強化學習技術,通過獎勵和懲罰來教導系統。故此它在數學和編程等方面表現更加出色。OpenAI目前的旗艦模型GPT-4o在國際數學奧林匹克競賽的資格考試中,僅能正確回答13%的問題,而o1的成功率高達83%。

OpenAI官網圖片

OpenAI官網圖片

「幻覺」減少但未完全解決

o1的另一個突破,是使用「思維鏈」來處理查詢,類似人類逐步解決問題的方式。特沃雷克指出,這種新的訓練方法使模型更加準確,「幻覺」問題有所減少,但仍未完全解決,因此最終還是要人類來做最後的檢查。

OpenAI官網截圖

OpenAI官網截圖

研究指出,長期依賴AI背後有代價,僅短短輔助10分鐘後,獨立解題表現跌20%。

僅短短用AI輔助10分鐘獨立解題表現即跌20%。AP圖片

僅短短用AI輔助10分鐘獨立解題表現即跌20%。AP圖片

AI普及引發過度依賴憂慮

人工智能愈來愈普及,不少人已習慣在工作、學習甚至日常生活中借助AI尋找答案、整理資料或解決問題。惟AI帶來便利的同時,也引發外界對「過度依賴」的憂慮。最新研究指出,即使只是短時間使用AI輔助工具,也可能影響使用者之後獨立思考及解難的表現,提醒人們在享受科技便利時,仍需保留自主思考的能力。

僅短短用AI輔助10分鐘獨立解題表現即跌20%。資料圖片

僅短短用AI輔助10分鐘獨立解題表現即跌20%。資料圖片

1222人實驗揭示停用AI後表現下滑

來自卡內基梅隆大學、牛津大學、麻省理工學院及加州大學洛杉磯分校的研究團隊,針對1222名受試者進行一系列隨機對照實驗,測試內容涵蓋數學推理及閱讀理解。研究人員將受試者分為兩組,一組全程不使用AI,自行完成題目;另一組則可在約10分鐘內使用AI輔助作答,但最後3道題目禁止再使用AI。結果顯示,使用AI輔助的受試者在前半段答題表現確實較佳,但當不能再使用AI後,解題成功率比從未使用AI的組別低20%,跳過題目不作答的機率更高出一倍。

僅短短用AI輔助10分鐘獨立解題表現即跌20%。資料圖片

僅短短用AI輔助10分鐘獨立解題表現即跌20%。資料圖片

直接索取答案最易削弱解難能力

研究團隊指出,使用AI的方式,是影響解題能力下降及跳題率上升的關鍵因素。在AI輔助組中,有61%受試者會直接要求AI提供答案,其餘部分受試者則只要求AI給予提示或釐清概念。結果發現,只獲得間接幫助的人,並未出現如直接

僅短短用AI輔助10分鐘獨立解題表現即跌20%。AP圖片

僅短短用AI輔助10分鐘獨立解題表現即跌20%。AP圖片

索取答案者般的解題能力下降情況。研究作者認為,這顯示AI本身未必會損害所有認知能力,但若使用者完全依賴AI直接提供答案,便可能削弱獨立思考及解決問題的能力。

短暫互動已可影響堅持度與自主解難

作者強調,與AI互動短短10至15分鐘,已可能導致獨立解難能力及堅持度明顯下降,而這兩項能力正是終身學習所需要的重要基礎。研究人員也警告,若短暫接觸AI已可造成明顯影響,長期每日使用AI數月至數年,累積效應恐怕更為嚴重,甚至難以逆轉。

AI「即問即答」模式或削弱耐性

另有調查顯示,去年有56%美國成年人曾使用AI工具,其中28%每星期至少使用一次。研究人員指出,AI容易令人習慣「即問即答」的模式,減少使用者獨立面對及克服難題的機會,長遠或會削弱面對困難時的耐性與堅持度。

AI發展應兼顧培養長期能力

研究團隊呼籲,未來AI模型的開發方向,不應只著眼於協助使用者完成短期任務,更應優先考慮如何培養人的長期能力,避免使用者在便利之中逐漸失去自主思考及解難能力。

你 或 有 興 趣 的 文 章