Skip to Content Facebook Feature Image

商湯發佈悟能具身智能平台 AI實現物理世界自我進化

BasTech

商湯發佈悟能具身智能平台 AI實現物理世界自我進化
BasTech

BasTech

商湯發佈悟能具身智能平台 AI實現物理世界自我進化

2025年07月29日 09:38 最後更新:18:05

商湯科技星期日(7月27日)在其承辦的「大愛無疆‧模塑未來」WAIC 2025大模型論壇上,正式發佈「悟能」具身智能平台。該平台以「開悟」世界模型為核心引擎,結合商湯在視覺感知、大裝置及日日新大模型等領域的技術積累,並依託商湯大裝置提供的端側與雲側算力支援,為機器人、智能設備賦予強大的感知、視覺導航及多模態交互能力,推動智能終端向更高層次的自主化與智能化演進。

商湯科技董事長兼首席執行官徐立在WAIC 2025大模型論壇上介紹「悟能」具身智能平台

商湯科技董事長兼首席執行官徐立在WAIC 2025大模型論壇上介紹「悟能」具身智能平台

商湯科技董事長兼首席執行官徐立表示:「世界模型和具身 AI的結合,將開啟 AI發展的下一個階段,完成由『工具』向『人』的躍遷,加速邁向 AGI時代。商湯希望『悟能』具身智能平台能夠幫助各類具身智能企業,幫助他們完成和現實世界交互的夢想。」


感知、導航和交互作為具身智能的三大核心能力,「悟能」平台在這三方面均展現出深厚實力,並將其轉化為「三大核心引擎」,可廣泛適配汽車、機器人等各類終端,實現空間層面的現實世界互動。

在感知方面,憑藉商湯方舟在視覺AI領域十餘年的深耕,「悟能」平台能為機器狗、機器人等各類終端硬體賦予萬物識別與理解能力,具備強大場景適配性,可完全嵌入端側晶片實現端側推理,提升感知效率與回應敏捷度。無論是機器狗還是機器人的視角,均能對外界形成整體天然感知識別,並對物體進行自然劃分切割。

導航方面,依託商湯絕影在純視覺端到端智能輔助駕駛方案的技術積累,「悟能」可泛化適配至機器人、機器狗等設備,確保其在多樣環境中實現精準路徑規劃與導航,並準確進行自動避障,無論是綠化小路中行動的小型機器狗,還是城區車道行駛的自動駕駛車輛均能如此。


交互能力上,基於「日日新」大模型的技術積累與反覆運算,「悟能」平台賦能機器人具備與現實世界交互的能力,呈現出有溫度、有深度、長記憶、超穩定等亮點。例如,由其賦能的人形機器人,能以風趣幽默、嚴謹務實等多種語言風格,生動講解AI生成的《長安的荔枝》電影介紹PPT。

「開悟」世界模型作為「悟能」平台的核心,憑藉強大的多模態深度理解能力,具備合理的空間與時間一致性,可生成高品質數據,有效提升具身智能終端設備的智能水平。該模型僅憑自然語言描述,就能生成逼真的七路攝像頭視角模擬數據,且不同視角的幾何位置高度對應,完全符合物理世界規律。

此外,「開悟」世界模型還能編輯真實世界,對現實場景中的車輛等元素進行替換、刪除、增補,創造更多樣的現實場景。基於這些生成和編輯能力,模型可精準模擬方向盤、刹車和油門控制,帶來如在真實街道場景中玩「極品飛車」般的效果,助力機器在現實世界中自由探索。

相較於智能汽車,機器人適用場景更廣泛,能通過主動探索生成更多高品質現實世界數據。在當前具身智慧數據匱乏的環境下,「悟能」平台通過構建面向人、物、場的4D真實世界,有望突破模型泛化能力邊界。未來,商湯科技將持續助力具身智能企業實現感知、理解與生成能力的躍進,將具身交互的不確定性挑戰轉化為產業升級的確定性路徑,推動AI向下一個十年加速進化。

商湯科技(0020.HK)旗下大模型原生數據分析產品辦公小浣熊重磅推出「可編輯」的 AI PPT,從生成到提交,每一頁都由用戶掌控,真正實現「一鍵生成,頁頁可改」的辦公能力,在保留生成速度的同時,讓版面與內容都能完整自由編輯,真正做到高效率兼具高彈性,有效彌補市面上 AI PPT 工具在後續編輯上受限的不足。

多款高品質範本 即選即用

為應付時間緊迫的工作需求,辦公小浣熊在「PPT 生成-創意模式」中內置多款高質素、高審美的簡報風格範本。用戶只需選擇所需風格並輸入構思,即可快速生成可直接使用的簡報內容,毋須從空白頁面開始構思,大幅縮短製作時間。

從生成到提交 每一頁均可獨立編輯

商湯辦公小浣熊的可編輯 AI PPT,強調將「編輯主導權」全面交回用戶,支援單頁獨立修改,用戶可針對指定頁面進行重新生成、文案潤飾、文字手動修改、字體字號調節及圖片替換,而不會影響整份簡報的結構與風格,避免因局部調整而需要重做整份 PPT。

系統同時支援深度編輯,用戶調整頁面中的元素後,可交由 AI 進行餘下重複的修改工作,用戶可專注於關鍵的創意決策。

支援企業自訂風格 貼合品牌視覺規範

商湯辦公小浣熊推「可編輯」AI PPT 實現一鍵生成頁可改

商湯辦公小浣熊推「可編輯」AI PPT 實現一鍵生成頁可改

針對企業對品牌形象一致性的要求,商湯辦公小浣熊亦支援上傳公司既有範本或品牌素材手冊。系統有「現場學藝」的能力,可分析用戶上傳的 PPT、圖片或 PDF 文件,自動學習當中的視覺邏輯、配色、版面及字體風格,並套用至新生成的簡報內容,確保輸出成果與企業既有品牌視覺規範一致,用戶上傳的參考素材愈多,生成效果愈貼近原有風格,減少「AI 痕跡」帶來的違和感。

素材庫及流程體驗全面升級

是次更新亦同步優化整體使用體驗。全新素材庫功能支援上傳最多 100 張圖片或商標,讓用戶建立個人化素材庫,隨時調用。系統同時提供可追蹤、可編輯的生成流程,並在完成後自動提醒用戶,讓用戶可在等待期間處理其他工作,進一步提升整體辦公效率。

你 或 有 興 趣 的 文 章