OpenAI推多模態AI模型GPT-4 可支援圖片輸入及以文字解釋圖像等

大視野

OpenAI推多模態AI模型GPT-4 可支援圖片輸入及以文字解釋圖像等

2023年03月15日 16:19 最後更新：18:12

以開發出聊天機械人ChatGPT聞名的OpenAI，周二發布名為GPT-4的最新人工智能 (AI) 模型，除了準確度、創造力和協作性更高之外，GPT-4還可支援圖片輸入功能，並以文字來解釋圖像內容，甚至回答問題；甚至輸入一張手繪設計草圖就能自動產生對應的網頁程式碼。

點擊看圖輯

GPT-4可以用來解釋組合圖，各圖的重點，該圖為「VGA轉接頭接上iPhone手機」。OpenAI

GPT-4可解讀分析圖表內容。OpenAI

GPT-4可以看圖找出問題的答案。OpenAI

問及圖中異常之處，GPT-4也可以找出。

迷因圖片也難不到GPT-4，而且不失幽默。OpenAI

GPT-4可以分解解讀漫畫的重點。OpenAI

多模態AI模型GPT-4，可支援圖片輸入，可解釋還能生成網頁程式碼。OpenAI

更多相片

GPT-4可以用來解釋組合圖，各圖的重點，該圖為「VGA轉接頭接上iPhone手機」。OpenAI

GPT-4可解讀分析圖表內容。OpenAI

GPT-4可以看圖找出問題的答案。OpenAI

問及圖中異常之處，GPT-4也可以找出。

迷因圖片也難不到GPT-4，而且不失幽默。OpenAI

GPT-4可以分解解讀漫畫的重點。OpenAI

多模態AI模型GPT-4，可支援圖片輸入，可解釋還能生成網頁程式碼。OpenAI

https://youtu.be/outcGtbnMuQ

報道指，現時的ChatGPT屬於GPT-3.5版本，其於文字及圖片上的表現已相當出色，吸引眾多科企將旗下產品加入該技術。而GPT-4是一個多模態的AI模型，除了文字輸入以外，還可透過圖像輸入來生成內容。

GPT-4會以文字來解釋圖片內容，並且符合文字任務的要求。輸入的圖片可以是照片、圖表或螢幕截圖。舉例來說，如果用家發送雪櫃內部的圖片，GPT-4不僅能正確識別有甚麼，還會調製可以用這些材料製成的東西。

未來，GPT-4還將持續強化解圖能力，例如可以輸入多組圖片範例，或是提供分解動作解釋的解圖能力。

OpenAI透過網誌表示，使用微軟的Azure訓練GPT-4模型，相較於前一版的GPT-3.5，GPT-4有了巨幅改進，又指新模型將產生更少的錯誤答案、減少偏離軌道和談論禁忌話題的頻率。

較早前，在與ChatGPT或Bing的的互動中，傳出許多用家被呈現謊言、侮辱或其他所謂的「幻覺」。OpenAI表示：「我們花了6個月的時間使GPT-4更安全、更一致。GPT-4回應不允許內容請求降低了82%，產生事實回應的可能性增加了40%」。

在模擬美國法學院畢業生參加律師考試的實測中，GPT-4的分數可達到前10%左右，GPT-3.5卻只能落在最底的10%。在SAT數學測驗或GRE測驗等30多項不同學科的主流檢定測驗上，GPT-4都大勝3.5版。

OpenAI宣稱，GPT-4英文答題的正確率達到80.5%，高於3.5版的70.1%，甚至也高於Google日前的PaLM模型英文答題的69.3%正確率。不過，PaLM答題正確率是OpenAI自行實測的結果，而非Google官方數據。值得注意的是，GPT-4對翻譯成中文版的MMLU答題正確率也達到了80.1%，日語和韓語版也都有70至80％的正確率。

OpenAI說，雖然在一般對話中，GPT-3.5和GPT-4兩種版本模型的生成內容相當類似，但是當任務的複雜度達到一定門檻時，差異就會浮現，GPT-4更有能力處理更細膩的指令。

根據OpenAI，摩根士丹利正在使用 GPT-4 來整理數據，電子支付商Stripe也在測試是否可利用GPT-4來杜絕詐騙，其他客戶還包含線上語言學習 App「Duolingo」、線上學習平台可汗學院 (Khan Academy) 以及冰島政府。

GPT-4目前先開放了文字輸入功能予ChatGPT Plus付費用戶，特定合作夥伴可優先排入試用新版。至於圖片輸入功能目前仍在預覽階段。

往下看更多文章

韋氏字典2025年度詞出爐：「Slop」數碼餿水當選！直批AI產出低質垃圾內容

韋氏字典（Merriam-Webster）15日宣布，選擇「Slop」（數碼餿水）為2025年年度代表詞彙，以反映大眾對「低品質AI產物」的厭惡與無奈。

Springfield’s Merriam-Webster looks to AI ‘slop’ as word of the year https://t.co/CvWMhZtLyl
— masslivenews (@masslivenews) December 16, 2025

被定義為「由AI大量製造的低品質數碼內容」

韋氏字典總裁巴洛（Greg Barlow）表示，「Slop」一詞極具畫面感，原指1700年代的「稀泥」或餵豬用的「餿水」，現被定義為「由AI大量製造的低品質數碼內容」，包括荒謬影片、怪異廣告圖片、俗氣宣傳、看似真實的假新聞和AI撰寫的垃圾電子書。雖然AI影片生成器如Sora可迅速製作逼真影像，但也導致社交媒體淹沒於大量深偽（deepfakes）和錯誤資訊。

Slop has been chosen as Merriam-Webster’s 2025 word of the year

The term has been used often this year for awful AI-generated content pic.twitter.com/amoQBmUhOB
— DiscussingFilm (@DiscussingFilm) December 15, 2025

韋氏字典總裁：代表大眾已意識到內容的虛假

人們渴望真實，「Slop」成為對抗的代名詞。詞彙讓人聯想到豬隻在髒亂槽邊進食的畫面，如同人們被迫接受演算法推播的垃圾訊息。巴洛認為，此詞的流行帶來希望，代表大眾已意識到內容的虛假，並開始渴望「真實」和「真誠」。他表示：「這幾乎是對抗AI的詞彙」，當AI取代人類創造力時，有時看起來並不那麼聰明。

"Slop," defined as "digital content of low quality that is produced usually in quantity by means of artificial intelligence," has been chosen by Merriam-Webster's human editors as the dictionary's 2025 word of the year.

"All that stuff dumped on our screens, captured in just… pic.twitter.com/23pQGcyj57
— PBS News (@NewsHour) December 15, 2025

熱門詞彙還包括「Touch grass」等

除了「Slop」，今年的熱門詞彙還包括「Touch grass」（去摸草），呼籲沉迷網路的人回歸現實參與活動；受特朗普貿易政策影響搜尋量增加的「Tariffs」（關稅）。

你或有興趣的文章

OpenAI推多模態AI模型GPT-4 可支援圖片輸入及以文字解釋圖像等

大視野

OpenAI推多模態AI模型GPT-4 可支援圖片輸入及以文字解釋圖像等

GPT-4可以用來解釋組合圖，各圖的重點，該圖為「VGA轉接頭接上iPhone手機」。OpenAI

GPT-4可解讀分析圖表內容。OpenAI

GPT-4可以看圖找出問題的答案。OpenAI

問及圖中異常之處，GPT-4也可以找出。

迷因圖片也難不到GPT-4，而且不失幽默。OpenAI

GPT-4可以分解解讀漫畫的重點。OpenAI

多模態AI模型GPT-4，可支援圖片輸入，可解釋還能生成網頁程式碼。OpenAI

GPT-4可以用來解釋組合圖，各圖的重點，該圖為「VGA轉接頭接上iPhone手機」。OpenAI

GPT-4可解讀分析圖表內容。OpenAI

GPT-4可以看圖找出問題的答案。OpenAI

問及圖中異常之處，GPT-4也可以找出。

迷因圖片也難不到GPT-4，而且不失幽默。OpenAI

GPT-4可以分解解讀漫畫的重點。OpenAI

多模態AI模型GPT-4，可支援圖片輸入，可解釋還能生成網頁程式碼。OpenAI

往下看更多文章

韋氏字典2025年度詞出爐：「Slop」數碼餿水當選！直批AI產出低質垃圾內容

AI逼出復古潮！美國大學重推「一對一問答口試」防作弊

AI設計師膺《時代》年度風雲人物馬斯克黃仁勳等8人上榜

美初創公司發布「全球最小個人AI超級電腦」獲健力士世界紀錄認證

「港話通」試行版助長者融入智慧城市享受數碼新生活

AI體適能系統進校園以科技重塑校園體育氛圍

採菇用AI判毒日本七旬翁誤食險喪命專家急籲：野菇勿亂食

《阿凡達》新片唔用AI生成內容占士金馬倫：尊重演員唔會用AI取代佢哋

OpenAI推多模態AI模型GPT-4 可支援圖片輸入及以文字解釋圖像等

OpenAI推多模態AI模型GPT-4 可支援圖片輸入及以文字解釋圖像等

GPT-4可以用來解釋組合圖，各圖的重點，該圖為「VGA轉接頭接上iPhone手機」。OpenAI

GPT-4可解讀分析圖表內容。OpenAI

GPT-4可以看圖找出問題的答案。OpenAI

問及圖中異常之處，GPT-4也可以找出。

迷因圖片也難不到GPT-4，而且不失幽默。OpenAI

GPT-4可以分解解讀漫畫的重點。OpenAI

多模態AI模型GPT-4，可支援圖片輸入，可解釋還能生成網頁程式碼。OpenAI

GPT-4可以用來解釋組合圖，各圖的重點，該圖為「VGA轉接頭接上iPhone手機」。OpenAI

GPT-4可解讀分析圖表內容。OpenAI

GPT-4可以看圖找出問題的答案。OpenAI

問及圖中異常之處，GPT-4也可以找出。

迷因圖片也難不到GPT-4，而且不失幽默。OpenAI

GPT-4可以分解解讀漫畫的重點。OpenAI

多模態AI模型GPT-4，可支援圖片輸入，可解釋還能生成網頁程式碼。OpenAI

往下看更多文章

韋氏字典2025年度詞出爐：「Slop」數碼餿水當選！直批AI產出低質垃圾內容

AI逼出復古潮！美國大學重推「一對一問答口試」防作弊

AI設計師膺《時代》年度風雲人物 馬斯克黃仁勳等8人上榜

美初創公司發布「全球最小個人AI超級電腦」 獲健力士世界紀錄認證

「港話通」試行版助長者融入智慧城市 享受數碼新生活

AI體適能系統進校園 以科技重塑校園體育氛圍

採菇用AI判毒 日本七旬翁誤食險喪命 專家急籲：野菇勿亂食

《阿凡達》新片唔用AI生成內容 占士金馬倫：尊重演員 唔會用AI取代佢哋

AI設計師膺《時代》年度風雲人物馬斯克黃仁勳等8人上榜

美初創公司發布「全球最小個人AI超級電腦」獲健力士世界紀錄認證

「港話通」試行版助長者融入智慧城市享受數碼新生活

AI體適能系統進校園以科技重塑校園體育氛圍

採菇用AI判毒日本七旬翁誤食險喪命專家急籲：野菇勿亂食

《阿凡達》新片唔用AI生成內容占士金馬倫：尊重演員唔會用AI取代佢哋