Skip to Content Facebook Feature Image

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?
博客文章

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

2024年05月15日 11:32 最後更新:11:46

當地時間5月13日10時,OpenAI首席技術官Mira Murati在全球矚目的春季發佈會上揭幕了新一代AI巨擘——GPT-4o。這款全能型AI模型以其超乎尋常的實時多模態對話能力,引發全球關注。

OpenAI首席技術官Mira Murati。

OpenAI首席技術官Mira Murati。

據《華爾街見聞》,GPT-4o的特性在於其高度的即時響應和表達能力,如同真實人類一般,能夠同時處理文字、圖像、視頻和語音信息,且接受和中斷對話自如。OpenAI創始人Sam Altman暗示了GPT-4o強大的擬人化能力,他在社交平台上引用了電影《Her》中的概念,預示人機交互或開啓新篇章。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

Murati宣佈,相較於GPT-4 Turbo,GPT-4o速度提升了兩倍,開放API接口的同時,用戶請求速率上限提升至之前的五倍。

更為引人關注的是,這一先進模型將全面免費開放,惠及ChatGPT的所有用戶,取消其他所有限制,API價格降低50%。

發佈會還展示了桌面版ChatGPT及全新用戶界面(UI)。

GPT-4o即日起逐步向用戶開放,未來還將增加語音和視頻理解等功能。

Murati稱,GPT-4o為每個用戶都提供了GPT-4級別的智能,同時還改進了GPT-4在文本、視覺以及音頻方面的能力。

借助GPT-4o,OpenAI通過跨文本、視覺和音頻端到端訓練了新模型,使得所有輸入和輸出都由同一神經網絡處理,進一步降低了延遲。

AP圖片

AP圖片

據稱,GPT-4o的語音響應延遲已顯著降低,平均為320毫秒,接近人類對話的反應速度。

演示環節,Murati邀研究主管Mark Chen和後訓練團隊負責人Barret Zoph共同展示了GPT-4o的強大功能,包括解方程、解讀代碼、實時翻譯,甚至能通過視頻識別面部情緒。

1)看圖指導解方程
演示中,Zoph在白板上寫了一個方程式3x+1=4,ChatGPT給他提示,引導他完成每一步解答,識別他的書寫結果,幫助他解出了X的值。

2)解讀屏幕信息
Zoph將一段Python代碼輸入ChatGPT,並讓ChatGPT用一句話總結這段代碼在做什麼。GPT回答無誤,並詳細說明瞭數據是如何被處理的。

隨後,Zoph又運行了這段代碼,GPT能夠準確地描述出所生成圖表的具體含義,包括圖表主題、XY軸信息、峰值水平。

3)實時交替翻譯
GPT還在演示中扮演了翻譯員的角色。應社交媒體X的用戶請求,Murati現場對ChatGPT說起了意大利語,GPT則將她的話翻譯成英語,轉告Zoph和Chen;聽完Murati說的意大利語,GPT再將其翻譯為英文並告訴Chen:「Mark,她(Murati)想知道鯨魚會不會說話,它們會告訴我們什麼?」 

4)通過視頻識別面部情緒
演示中,Zoph將手機舉到自己面前正對著臉,要求ChatGPT檢測他現在的情緒。最初,GPT參考了他之前分享的一張照片,將他識別為「木質表面」。經過第二次嘗試,GPT表示:「你看起來非常的開心,可能還有一點激動,看樣子你應該心情很不錯。」

Zoph贊揚了GPT的回答並表示自己正在進行一場演示,以展示「你有多不可思議」,此時GPT情緒頗為激動地表示:「快別說了!你讓我害羞了。」

這些演示彷彿證實了GPT-4o的特性,其「o」代表著「omni」,象徵著「全能」。

在後續的網絡實測視頻中,官方和用戶還探索出了GPT-4o的花樣玩法。

將老照片中的手寫字轉錄為電子文本。

將老照片中的手寫字轉錄為電子文本。

共享iPad屏幕後,讓GPT實時指導教學幾何題目。

和GPT視頻玩「石頭剪刀布」。

和GPT視頻玩「石頭剪刀布」。

正如Murati說,GPT-4o的發佈意味著OpenAI在大模型的易用性方面邁出了一大步,Ta正在改變人機交互的協作模式。

那麼,AI手機還會遠嗎?

此前有媒體報道透露,蘋果已經與OpenAI達成協議,將在全新操作系統iOS 18中引入ChatGPT技術,以升級Siri的對話體驗。

AP圖片

AP圖片

這不由令人猜想,GPT-4o和Siri將如何結合?OpenAI和蘋果會締造出具有跨時代意義的AI手機嗎?

英偉達高級研究科學家Jim Fan在X平台表示,iOS集成GPT技術可能會有三個層級:
1)放棄Siri。OpenAI為iOS提煉出更小型、純設備上的GPT-4o,並可選擇付費升級以使用雲。
2)將相機或屏幕傳輸到模型中的基礎功能。對神經音頻/視頻編解碼器的芯片級支持。
3)集成iOS系統操作API和智能家居API。Siri快捷方式是時候復活了。

有分析指出,蘋果和OpenAI的合作能夠解決彼此在發展邊緣AI方面的痛點,真正做到各取所需。

目前,有分析預測,蘋果將在6月10日的WWDC大會上官宣和OpenAI的合作夥伴關係,並推出基於蘋果LLM的AI聊天機器人。

AP圖片

AP圖片

令人激動的是,已經有移動端App開始接入GPT-4o了。

用於輔助盲人和弱勢群體日常生活的手機App Be My Eyes嘗試了接入GPT-4o,發現日常決策的效率被大大提高。

AP圖片

AP圖片

宣傳視頻顯示,一名盲人打開Be My Eyes後,能夠通過和GPT-4o對話,讓GPT詳細告訴他眼前的景象,從而快速做出決策。

有網友表示,這是GPT-4o的最佳用例,它將為視障人士創造一個全新的世界。

AP圖片

AP圖片

在所有演示結束後,Murati總結道:「正如大家所見,(如今的ChatGPT)真的很神奇。」




深喉

** 博客文章文責自負,不代表本公司立場 **

Tags:

理文OpenAI

圍繞駐韓美軍在黃海實施大規模空中訓練引發爭議一事,韓美軍方表述出現明顯溫差。

內地環球網報道,在南韓國防部釋放「駐韓美軍司令道歉」的信息後,駐韓美軍罕見深夜發表聲明,強調不存在需要道歉的問題,雙方在訓練通報及軍事政策上的分歧隨之浮出水面。報道引述韓媒分析稱,駐韓美軍的反應一定程度上折射出韓美同盟內部潛在的結構性緊張。

AP圖片

AP圖片

韓聯社24日援引軍方消息稱,駐韓美軍司令兼韓美聯合司令部司令布倫森就黃海訓練中與中方戰機對峙引發緊張一事向韓方道歉。但消息發布後,駐韓美軍當晚發表正式聲明反駁稱,布倫森與南韓國防部長官安圭伯通話時,僅對韓方未能及時接到訓練報告「表示遺憾」,並重申已事先通報訓練計劃,強調例行戰備訓練「無需道歉」。

此次爭議源於18日至19日駐韓美軍在烏山基地開展的大規模空中訓練。據韓媒報道,美軍F-16戰機出動至黃海公海上空超100次。在訓練過程中,F-16戰機進入南韓防空識別區與中國防空識別區之間、雙方識別區未重疊的區域。隨著駐韓美軍戰機接近中國防識區,中方也出動戰機應對,導致雙方一度對峙。安圭伯得知後於19日致電布倫森抗議,質疑美方未充分共享可能加劇地區緊張的訓練細節。訓練隨後提前結束,但雙方的爭論並未平息。

此次「道歉風波」引發韓媒廣泛關注。南韓《時事雜誌》將這場風波定性為「韓美軍事當局間不和諧音」,指出韓方不滿美方僅通報「有訓練」,未說明具體飛行目的等關鍵信息;美方則辯稱訓練信息已提前提供,問題出在韓方內部信息共享不及時。報道認為,此次道歉風波已不再只是表述方式或立場層面的分歧,而是暴露出雙方在軍事溝通與政策協調機制上的不一致。

《首爾新聞》評論稱,駐韓美軍在半島周邊開展高強度訓練卻未讓韓方充分掌握信息,令人擔憂「韓美同盟齒輪鬆動」。評論還指出,美國主張的「戰略靈活性」將駐韓美軍重心轉向牽制中國,這可能讓南韓捲入有違自身意願的地區衝突,與南韓現政府緩和地區緊張的政策相悖。《朝鮮日報》認為,駐韓美軍深夜發聲明澄清實屬罕見,而南韓國防部發言人在回應有關問詢時僅表示「相關報道部分內容屬實」,未進行詳細說明。

彭博社評論認為,此次美韓罕見公開摩擦顯示出李在明政府尋求避免在美中之間選邊站隊時所面臨的挑戰,這種做法與前任政府明確優先發展與韓美、韓日關係有所不同。《南華早報》也援引專家分析稱,韓方就美中戰機對峙向美方提出抗議,表明其不樂見駐韓美軍與中方進行積極對抗。

事實上,近期韓美圍繞軍事事務的「不和諧音」頻現,除黃海訓練爭議外,韓美在「自由之盾」聯合演習的野外機動訓練規模上也未達成一致。雙方在協調未完成的情況下便公布演習方案,被認為極不尋常。南韓軍方主張將訓練分散至全年進行,以降低集中訓練帶來的緊張。而駐韓美軍認為相關兵力與預算已提前部署,堅持按既定計劃執行,分歧至今未彌合。接連出現的敏感議題,給韓美軍事協調帶來不小壓力。

你 或 有 興 趣 的 文 章