電腦科學家路易斯·卡斯特里卡托研究大型語言模型,即ChatGPT及Claude等聊天機械人背後的人工智能技術,已達第八年,當時他開始感到遇到瓶頸。
卡斯特里卡托表示:「我們基本上已超越進行真正基礎大型語言模型研究的階段。現在只剩下應用層面。」
檔案圖片:2025年8月4日,芝加哥,智能手機屏幕上顯示Chat GPT應用程式圖標。(美聯社圖片/佐藤喜一郎) AP圖片
這位研究員其後離開布朗大學,創立一間名為Overworld的新公司。其抱負體現於公司名稱:即開發能夠理解及導航現實世界,而不僅僅是文字的人工智能。
人工智能聊天機械人仍有龐大商機,投資者正投入數萬億美元予Anthropic及OpenAI等領先開發商。然而,越來越多人工智能企業家正致力於他們視為下一個前沿領域的發展:「世界模型」,即教導人工智能系統,有時甚至是機械人,如何在實體環境中作出反應。
檔案圖片:2024年9月24日,紐約,電腦科學家李飛飛在克林頓全球倡議活動上發言。(美聯社圖片/安德烈斯·庫達基) AP圖片
當中包括該領域一些最傑出的科學家,例如「人工智能教母」李飛飛,她形容「世界模型」的概念是「現今人工智能領域中最重要且最被濫用的術語之一」。
世界模型研究的核心理念是,如果人工智能只能閱讀書本,它便無法真正智能。它還需要洞察環境。
李飛飛是三藩市初創公司World Labs的創辦人,她於本月發表的一篇文章中寫道:「語言模型學習文本的統計結構,而世界模型則學習空間與時間的統計結構:例如光線如何落在表面、花園從未被鏡頭捕捉過的角度看起來如何、物體如何對力作出反應並遵循物理定律。」
另一位支持者是人工智能先驅揚·勒昆,他去年辭去Meta首席人工智能科學家一職,創立了總部位於巴黎的Advanced Machine Intelligence Labs。
勒昆在最近一集「Unsupervised Learning」播客中表示:「世界模型正迅速成為一個熱門詞彙。」他指,他認為這是一種能讓人工智能代理「預測其自身行為後果」的技術。
世界模型有多種定義方式,通常取決於人們希望利用它來構建的技術,無論是機械人還是更具互動性的電子遊戲。
人工智能語言模型透過訓練人類所有書籍、新聞文章及視覺媒體,已催生出正在改變辦公室工作及部分創意領域的人工智能助理。然而,一些支持者認為,透過重複預測下一個詞語或像素來生成新對話、圖像或程式碼的生成式人工智能模型存在局限。
卡內基梅隆大學電腦科學院院長馬丁·赫伯特指出,聊天機械人無法拿起咖啡杯。
赫伯特表示:「這涉及世界的所有幾何結構、我移動手部的動態,以及與杯子接觸的實體互動。這比僅僅預測句子中的下一個詞語複雜得多。」
對於像赫伯特這樣,已花費超過四十年研究機械人學的科學家而言,世界模型最實用的應用是為「實體人工智能」——另一個科技行業熱門詞彙——提供更快、更便宜的途徑。
赫伯特在一次訪問中表示:「有些人可能有不同的定義,但實體人工智能及具身人工智能可說是我們過去所稱的機械人學的演變。」他指,一些使聊天機械人如此有用的人工智能進展,亦可應用於構建對其環境有足夠廣泛認知的實體人工智能,使其像機械人的大腦一樣運作。
他說:「在你的身體及脊髓中,你擁有一個關於如何平衡、如何走動的通用模型,你可以適應早上膝蓋疼痛,因此你現在走路方式會略有不同。你不需要思考這些。你的神經系統及大腦中某處有一個通用模型,讓你的身體能夠迅速適應。」
更智能的機械人並非世界模型的唯一終極目標。卡斯特里卡托去年創立Overworld,這間位於羅德島的小型初創公司現正構建電子遊戲世界,例如一個陰森森林的場景,可以隨著虛擬角色在其中移動並與物件互動而作出適應。
他在一次訪問中表示:「沒有其他世界模型能讓你直接穿過門,或與如此詳細的環境互動。我們將互動性置於首位。」
儘管其近期應用不如人工智能編碼工具般顯而易見,但世界模型開發商正吸引創業投資者的興趣,例如Kindred Ventures的聯合創辦人兼管理合夥人史蒂夫·張。
該公司正投資Overworld及其他專注於世界模型的公司,包括正在構建用於天氣預測人工智能模型的Causal Labs,以及正在構建適用於世界模型的專用電腦晶片的Extropic。
張表示:「我認為未來將會是許多不同類型、具有不同理念及架構的模型。我不認為會出現一個龐大、密集的模型來統治所有。」
李飛飛在她最近的文章中,試圖建立「世界模型的分類學」,以幫助釐清關於相互競爭願景的混淆。
她寫道:「一個產生華麗但物理上不可能火焰的影片模型、一個即興創作可玩遊戲的語言模型,以及一個忠實模擬燃燒的物理引擎,都以相同的名稱稱呼。」
她將世界模型分為三個類別。現今最具商業可行性的是「渲染器」,它們優先考慮所創建虛擬世界的視覺保真度,但無法被信任來教導機械人太多東西。
其次是「模擬器」,它們創建虛擬訓練場,忠實呈現世界的實體結構;以及「規劃器」,它們嘗試預測人工智能代理或機械人在非結構化世界中應該做甚麼。
她寫道:「一個能夠規劃的機械人就是一個能夠工作的機械人,整個行業正競相成為第一個達到目標的。」
(美聯社)