Skip to Content Facebook Feature Image

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?
博客文章

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

2024年05月15日 11:32 最後更新:11:46

當地時間5月13日10時,OpenAI首席技術官Mira Murati在全球矚目的春季發佈會上揭幕了新一代AI巨擘——GPT-4o。這款全能型AI模型以其超乎尋常的實時多模態對話能力,引發全球關注。

OpenAI首席技術官Mira Murati。

OpenAI首席技術官Mira Murati。

據《華爾街見聞》,GPT-4o的特性在於其高度的即時響應和表達能力,如同真實人類一般,能夠同時處理文字、圖像、視頻和語音信息,且接受和中斷對話自如。OpenAI創始人Sam Altman暗示了GPT-4o強大的擬人化能力,他在社交平台上引用了電影《Her》中的概念,預示人機交互或開啓新篇章。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

Murati宣佈,相較於GPT-4 Turbo,GPT-4o速度提升了兩倍,開放API接口的同時,用戶請求速率上限提升至之前的五倍。

更為引人關注的是,這一先進模型將全面免費開放,惠及ChatGPT的所有用戶,取消其他所有限制,API價格降低50%。

發佈會還展示了桌面版ChatGPT及全新用戶界面(UI)。

GPT-4o即日起逐步向用戶開放,未來還將增加語音和視頻理解等功能。

Murati稱,GPT-4o為每個用戶都提供了GPT-4級別的智能,同時還改進了GPT-4在文本、視覺以及音頻方面的能力。

借助GPT-4o,OpenAI通過跨文本、視覺和音頻端到端訓練了新模型,使得所有輸入和輸出都由同一神經網絡處理,進一步降低了延遲。

AP圖片

AP圖片

據稱,GPT-4o的語音響應延遲已顯著降低,平均為320毫秒,接近人類對話的反應速度。

演示環節,Murati邀研究主管Mark Chen和後訓練團隊負責人Barret Zoph共同展示了GPT-4o的強大功能,包括解方程、解讀代碼、實時翻譯,甚至能通過視頻識別面部情緒。

1)看圖指導解方程
演示中,Zoph在白板上寫了一個方程式3x+1=4,ChatGPT給他提示,引導他完成每一步解答,識別他的書寫結果,幫助他解出了X的值。

2)解讀屏幕信息
Zoph將一段Python代碼輸入ChatGPT,並讓ChatGPT用一句話總結這段代碼在做什麼。GPT回答無誤,並詳細說明瞭數據是如何被處理的。

隨後,Zoph又運行了這段代碼,GPT能夠準確地描述出所生成圖表的具體含義,包括圖表主題、XY軸信息、峰值水平。

3)實時交替翻譯
GPT還在演示中扮演了翻譯員的角色。應社交媒體X的用戶請求,Murati現場對ChatGPT說起了意大利語,GPT則將她的話翻譯成英語,轉告Zoph和Chen;聽完Murati說的意大利語,GPT再將其翻譯為英文並告訴Chen:「Mark,她(Murati)想知道鯨魚會不會說話,它們會告訴我們什麼?」 

4)通過視頻識別面部情緒
演示中,Zoph將手機舉到自己面前正對著臉,要求ChatGPT檢測他現在的情緒。最初,GPT參考了他之前分享的一張照片,將他識別為「木質表面」。經過第二次嘗試,GPT表示:「你看起來非常的開心,可能還有一點激動,看樣子你應該心情很不錯。」

Zoph贊揚了GPT的回答並表示自己正在進行一場演示,以展示「你有多不可思議」,此時GPT情緒頗為激動地表示:「快別說了!你讓我害羞了。」

這些演示彷彿證實了GPT-4o的特性,其「o」代表著「omni」,象徵著「全能」。

在後續的網絡實測視頻中,官方和用戶還探索出了GPT-4o的花樣玩法。

將老照片中的手寫字轉錄為電子文本。

將老照片中的手寫字轉錄為電子文本。

共享iPad屏幕後,讓GPT實時指導教學幾何題目。

和GPT視頻玩「石頭剪刀布」。

和GPT視頻玩「石頭剪刀布」。

正如Murati說,GPT-4o的發佈意味著OpenAI在大模型的易用性方面邁出了一大步,Ta正在改變人機交互的協作模式。

那麼,AI手機還會遠嗎?

此前有媒體報道透露,蘋果已經與OpenAI達成協議,將在全新操作系統iOS 18中引入ChatGPT技術,以升級Siri的對話體驗。

AP圖片

AP圖片

這不由令人猜想,GPT-4o和Siri將如何結合?OpenAI和蘋果會締造出具有跨時代意義的AI手機嗎?

英偉達高級研究科學家Jim Fan在X平台表示,iOS集成GPT技術可能會有三個層級:
1)放棄Siri。OpenAI為iOS提煉出更小型、純設備上的GPT-4o,並可選擇付費升級以使用雲。
2)將相機或屏幕傳輸到模型中的基礎功能。對神經音頻/視頻編解碼器的芯片級支持。
3)集成iOS系統操作API和智能家居API。Siri快捷方式是時候復活了。

有分析指出,蘋果和OpenAI的合作能夠解決彼此在發展邊緣AI方面的痛點,真正做到各取所需。

目前,有分析預測,蘋果將在6月10日的WWDC大會上官宣和OpenAI的合作夥伴關係,並推出基於蘋果LLM的AI聊天機器人。

AP圖片

AP圖片

令人激動的是,已經有移動端App開始接入GPT-4o了。

用於輔助盲人和弱勢群體日常生活的手機App Be My Eyes嘗試了接入GPT-4o,發現日常決策的效率被大大提高。

AP圖片

AP圖片

宣傳視頻顯示,一名盲人打開Be My Eyes後,能夠通過和GPT-4o對話,讓GPT詳細告訴他眼前的景象,從而快速做出決策。

有網友表示,這是GPT-4o的最佳用例,它將為視障人士創造一個全新的世界。

AP圖片

AP圖片

在所有演示結束後,Murati總結道:「正如大家所見,(如今的ChatGPT)真的很神奇。」




深喉

** 博客文章文責自負,不代表本公司立場 **

Tags:

理文OpenAI

往下看更多文章

奧運安保響警報 法高鐵系統遭「有組織破壞」 官斥:針對奧運就是針對法國

2024年07月26日 17:31 最後更新:17:46

巴黎奧運開幕前夕,法國有高速列車遭人惡意破壞,導致高鐵系統陷入癱瘓。當局譴責有關行為,指針對奧運就是針對法國。

內地觀察者網引述法國國營鐵路公司(SNCF)消息,當地時間25日晚,法國高鐵系統遭遇「旨在癱瘓高鐵網絡的大規模攻擊」,大西洋、北部和東部線路發生了三起縱火事件,導致包括巴黎在內的全境高鐵交通出現嚴重中斷和延誤,預計下周一(29日)才能恢復正常交通。

「昨晚,法國國營鐵路公司成為多起惡意行為的受害者,這些行為同時影響了大西洋鐵路、北鐵路和東鐵路,」法國國營鐵路公司26日在社交媒體發布聲明稱,幾起同時發生的「縱火襲擊旨在破壞鐵路設施」。

AP圖片

AP圖片

聲明寫道,目前,鐵路團隊正在對鐵路系統進行緊急檢修。經查,大西洋線、北線和東線這三條高鐵線路受到嚴重干擾:一些列車車次被迫改道或取消。巴黎向南的高鐵線路發生了第四起縱火襲擊,但被挫敗。

法國國營鐵路公司還向法新社表示,這是一次「旨在癱瘓高鐵系統的大規模攻擊」,許多車次將不得不取消,這種情況將持續「至少整個周末,預計下周一將恢復正常交通」。

《費加羅報》報道稱,法國高鐵系統一片混亂,縱火襲擊「對鐵路系統的信號裝置造成了損害」。英國廣播公司(BBC)稱,「歐洲之星」高速列車在法國境內的服務也受到影響,出現延誤和改道。報道認為,很難不把襲擊事件與奧運會聯繫在一起。

目前,鐵路公司正懇請旅客推遲行程,並提供免費退換票服務。巴黎警察局長表示,他已部署了更多工作人員,以加強巴黎車站的安全系統。

社交媒體流傳的視頻和圖片顯示,在26日早高峰期間,法國旅客發現鐵路出現嚴重延誤和中斷後,紛紛在社交媒體發帖表達不滿。

AP圖片

AP圖片

AP圖片

AP圖片

同日晚些時候,法國交通部長維格里特在社交媒體X平台發聲,「強烈譴責」針對高鐵系統的攻擊行為。他寫道:「昨晚,多條高鐵線路遭到了有組織性惡意攻擊,交通將在本周末出現嚴重中斷。我強烈譴責這些犯罪行為,這將影響許多法國人的假期出行。」

法國體育部長接受法媒採訪。X截圖

法國體育部長接受法媒採訪。X截圖

法國體育部長烏迪亞-卡斯特拉接受法媒BFMTV採訪時,強烈譴責這一「蓄意破壞行為」。她說:「這確實令人震驚……反對奧運會就是反對法國。」

你 或 有 興 趣 的 文 章