Skip to Content Facebook Feature Image

「實體人工智能」成科技界新焦點 企業家競逐建構「世界模型」

商業事

「實體人工智能」成科技界新焦點 企業家競逐建構「世界模型」
商業事

商業事

「實體人工智能」成科技界新焦點 企業家競逐建構「世界模型」

2026年06月24日 12:01 最後更新:14:28

電腦科學家路易斯·卡斯特里卡托研究大型語言模型,即ChatGPT及Claude等聊天機械人背後的人工智能技術,已達第八年,當時他開始感到遇到瓶頸。

卡斯特里卡托表示:「我們基本上已超越進行真正基礎大型語言模型研究的階段。現在只剩下應用層面。」

檔案圖片:2025年8月4日,芝加哥,智能手機屏幕上顯示Chat GPT應用程式圖標。(美聯社圖片/佐藤喜一郎) AP圖片

檔案圖片:2025年8月4日,芝加哥,智能手機屏幕上顯示Chat GPT應用程式圖標。(美聯社圖片/佐藤喜一郎) AP圖片

這位研究員其後離開布朗大學,創立一間名為Overworld的新公司。其抱負體現於公司名稱:即開發能夠理解及導航現實世界,而不僅僅是文字的人工智能。

人工智能聊天機械人仍有龐大商機,投資者正投入數萬億美元予Anthropic及OpenAI等領先開發商。然而,越來越多人工智能企業家正致力於他們視為下一個前沿領域的發展:「世界模型」,即教導人工智能系統,有時甚至是機械人,如何在實體環境中作出反應。

檔案圖片:2024年9月24日,紐約,電腦科學家李飛飛在克林頓全球倡議活動上發言。(美聯社圖片/安德烈斯·庫達基) AP圖片

檔案圖片:2024年9月24日,紐約,電腦科學家李飛飛在克林頓全球倡議活動上發言。(美聯社圖片/安德烈斯·庫達基) AP圖片

當中包括該領域一些最傑出的科學家,例如「人工智能教母」李飛飛,她形容「世界模型」的概念是「現今人工智能領域中最重要且最被濫用的術語之一」。

世界模型研究的核心理念是,如果人工智能只能閱讀書本,它便無法真正智能。它還需要洞察環境。

李飛飛是三藩市初創公司World Labs的創辦人,她於本月發表的一篇文章中寫道:「語言模型學習文本的統計結構,而世界模型則學習空間與時間的統計結構:例如光線如何落在表面、花園從未被鏡頭捕捉過的角度看起來如何、物體如何對力作出反應並遵循物理定律。」

另一位支持者是人工智能先驅揚·勒昆,他去年辭去Meta首席人工智能科學家一職,創立了總部位於巴黎的Advanced Machine Intelligence Labs。

勒昆在最近一集「Unsupervised Learning」播客中表示:「世界模型正迅速成為一個熱門詞彙。」他指,他認為這是一種能讓人工智能代理「預測其自身行為後果」的技術。

世界模型有多種定義方式,通常取決於人們希望利用它來構建的技術,無論是機械人還是更具互動性的電子遊戲。

人工智能語言模型透過訓練人類所有書籍、新聞文章及視覺媒體,已催生出正在改變辦公室工作及部分創意領域的人工智能助理。然而,一些支持者認為,透過重複預測下一個詞語或像素來生成新對話、圖像或程式碼的生成式人工智能模型存在局限。

卡內基梅隆大學電腦科學院院長馬丁·赫伯特指出,聊天機械人無法拿起咖啡杯。

赫伯特表示:「這涉及世界的所有幾何結構、我移動手部的動態,以及與杯子接觸的實體互動。這比僅僅預測句子中的下一個詞語複雜得多。」

對於像赫伯特這樣,已花費超過四十年研究機械人學的科學家而言,世界模型最實用的應用是為「實體人工智能」——另一個科技行業熱門詞彙——提供更快、更便宜的途徑。

赫伯特在一次訪問中表示:「有些人可能有不同的定義,但實體人工智能及具身人工智能可說是我們過去所稱的機械人學的演變。」他指,一些使聊天機械人如此有用的人工智能進展,亦可應用於構建對其環境有足夠廣泛認知的實體人工智能,使其像機械人的大腦一樣運作。

他說:「在你的身體及脊髓中,你擁有一個關於如何平衡、如何走動的通用模型,你可以適應早上膝蓋疼痛,因此你現在走路方式會略有不同。你不需要思考這些。你的神經系統及大腦中某處有一個通用模型,讓你的身體能夠迅速適應。」

更智能的機械人並非世界模型的唯一終極目標。卡斯特里卡托去年創立Overworld,這間位於羅德島的小型初創公司現正構建電子遊戲世界,例如一個陰森森林的場景,可以隨著虛擬角色在其中移動並與物件互動而作出適應。

他在一次訪問中表示:「沒有其他世界模型能讓你直接穿過門,或與如此詳細的環境互動。我們將互動性置於首位。」

儘管其近期應用不如人工智能編碼工具般顯而易見,但世界模型開發商正吸引創業投資者的興趣,例如Kindred Ventures的聯合創辦人兼管理合夥人史蒂夫·張。

該公司正投資Overworld及其他專注於世界模型的公司,包括正在構建用於天氣預測人工智能模型的Causal Labs,以及正在構建適用於世界模型的專用電腦晶片的Extropic。

張表示:「我認為未來將會是許多不同類型、具有不同理念及架構的模型。我不認為會出現一個龐大、密集的模型來統治所有。」

李飛飛在她最近的文章中,試圖建立「世界模型的分類學」,以幫助釐清關於相互競爭願景的混淆。

她寫道:「一個產生華麗但物理上不可能火焰的影片模型、一個即興創作可玩遊戲的語言模型,以及一個忠實模擬燃燒的物理引擎,都以相同的名稱稱呼。」

她將世界模型分為三個類別。現今最具商業可行性的是「渲染器」,它們優先考慮所創建虛擬世界的視覺保真度,但無法被信任來教導機械人太多東西。

其次是「模擬器」,它們創建虛擬訓練場,忠實呈現世界的實體結構;以及「規劃器」,它們嘗試預測人工智能代理或機械人在非結構化世界中應該做甚麼。

她寫道:「一個能夠規劃的機械人就是一個能夠工作的機械人,整個行業正競相成為第一個達到目標的。」

(美聯社)

人工智能數據激活公司Boomi,今日在倫敦西敏橋公園廣場酒店舉行的「Boomi全球巡迴倫敦站」活動上,公布其2026財政年度歐洲、中東及非洲(EMEA)客戶創新獎得主。該活動於2026年6月23至24日舉行。

在歐洲、中東及非洲地區,新一代機構正重新定義數據驅動型業務的意義。這次歐洲、中東及非洲客戶創新獎得主,不僅僅是應用科技,更從根本上改變其機構的營運、競爭及增長方式。他們透過Boomi企業平台,將零散數據轉化為策略優勢,以智能自動化取代人手處理的複雜性,並在許多情況下為企業奠定基礎,使其能更快行動、更明智決策及更自信地運作。

Boomi公布2026財政年度歐洲、中東及非洲客戶創新獎得主 AP圖片

Boomi公布2026財政年度歐洲、中東及非洲客戶創新獎得主 AP圖片

Boomi歐洲、中東及非洲區總經理兼高級副總裁Adrian Trickett表示,獲表揚的機構並非被動等待轉型,而是主動推動轉型,從而獲得競爭優勢。無論是激活業務中以往隱藏的數據、打破阻礙其發展的壁壘,抑或大膽邁向全面自主型企業,每位得獎者都作出了帶來可衡量成果的決策,為其行業樹立了榜樣。Boomi企業平台旨在實現這類轉型,而看到歐洲、中東及非洲區客戶不斷拓展其功能界限,正是推動公司持續創新的動力。

Boomi作為人工智能數據激活公司,透過在整個業務中激活數據,為自主型企業提供動力。Boomi企業平台是活躍數據基礎,提供必要的自主型基礎設施,以推動自主型轉型。透過將代理設計與治理、API及MCP管理、整合與自動化,以及數據管理統一到單一平台,Boomi使機構能夠利用安全、可擴展的連接,發揮人工智能的潛力。Boomi獲超3萬名客戶信賴,並由超800個合作夥伴網絡支援,協助各種規模的機構實現敏捷性、效率及規模化創新。詳情可瀏覽boomi.com。

(美聯社)

你 或 有 興 趣 的 文 章