Skip to Content Facebook Feature Image

東大京大不在話下!AI再戰日本入學試 兩年由「全科落榜」到「全科榜首」

大視野

東大京大不在話下!AI再戰日本入學試 兩年由「全科落榜」到「全科榜首」
大視野

大視野

東大京大不在話下!AI再戰日本入學試 兩年由「全科落榜」到「全科榜首」

2026年04月29日 16:20 最後更新:17:19

日本AI新創公司的一項研究顯示,生成式人工智慧在頂尖大學入學考試中的答題能力正飛速躍進。

兩年間由「全科落榜」到「全科榜首」

東京LifePrompt公司於5月27日公布的分析結果指出,該公司使用ChatGPT 5.2 Thinking、Claude 4.5 Opus及Gemini 3 Pro Preview等多個頂尖大型語言模型,解答了今年東大與京大的入學試題。

結果顯示,ChatGPT在東大文、理共六個科別的總分均已超越今年實際錄取的人類最高分。尤其對比2024年的同類測試,當時ChatGPT在東大考試中仍處「全科落榜」水平,僅兩年時間其應試能力已有突破性成長。

理科表現卓越

測試詳情顯示,在總分550分的東大考試中,ChatGPT於理科一至三類獲得503分,遠高於真人理科三類榜首的453.6分,領先幅度顯著。即使在公認難度高的理科數學卷中,ChatGPT亦能取得滿分。

然而,在文科一至三類,其得分為452.7分,雖仍高於文科三類真人榜首的434.96分,但領先幅度較小。在文科的世界史申論題中,ChatGPT僅獲約25%的分數,凸顯其處理需要複雜論證、史觀分析的非固定答案題型時,能力仍有明顯局限。此弱點在如Claude與Gemini等受測模型中,也可以見到。

跨模型比較與評分方法

是次分析將大學入學共通考試成績與各校自行舉辦的「二次考試」分數合併計算,並與今年實際榜首成績比較。為確保評分公允,試卷中的申論題部分均由日本大型補習班河合塾的講師負責閱卷批改。

生成式人工智慧在頂尖大學入學考試中的答題能力正飛速躍進。資料圖片

生成式人工智慧在頂尖大學入學考試中的答題能力正飛速躍進。資料圖片

結果亦顯示,不同模型的表現存在差異。例如,Claude模型在東大文科部分類別及京都大學多個學部的測試中,分數仍低於真人榜首;而Gemini模型雖在東大全科超越榜首,但同樣呈現「理科優勢大、文科優勢小」的格局。

AI生成內容如雨後春筍,美國流行天后泰勒絲Taylor Swift為保護個人聲音和肖像,正式申請註冊商標,以防被AI及深偽技術濫用。

照片和聲音已大量出現在AI生成的深偽內容

報道指,Taylor Swift的照片和聲音已大量出現在AI生成的深偽內容中,包括不實廣告、虛假政治背書及露骨影像等。她於24日向美國專利商標局提交兩段錄音及一張照片,申請註冊商標。

旨在保護Taylor Swift免受AI帶來的威脅

律師指出,此舉旨在保護Taylor Swift免受AI帶來的威脅。雖然現有的「個人公開權法」對未經授權使用名人肖像提供了一定保護,但申請商標註冊能提供多一層保障。由於AI技術如今可在不複製原始錄音的情況下,生成模仿藝人聲音的全新內容,形成法律空白,而商標制度或許能補上這個缺口。

深偽內容可提告

日後若出現與Taylor Swift聲音及外形相似的AI生成圖像或聲音,將可能被視為侵犯商標,她有權提出訴訟。

美國流行天后Taylor Swift為保護個人聲音和肖像,正式申請註冊商標,以防被AI及深偽技術濫用。AP圖片

美國流行天后Taylor Swift為保護個人聲音和肖像,正式申請註冊商標,以防被AI及深偽技術濫用。AP圖片

你 或 有 興 趣 的 文 章