Skip to Content Facebook Feature Image

商湯科技聯上海敦煌當代美術館推「AI 智能講解器」革新導覽體驗

BasTech

商湯科技聯上海敦煌當代美術館推「AI 智能講解器」革新導覽體驗
BasTech

BasTech

商湯科技聯上海敦煌當代美術館推「AI 智能講解器」革新導覽體驗

2025年09月22日 17:42 最後更新:17:47

商湯科技為上海敦煌當代美術館的「登臨出世界」展覽提供「多模態智慧導覽」,參觀者只要拍攝場內展品,AI導遊就能自動辨識,講述文物背後的藝術脈絡、歷史淵源和科學知識,還可以實時回應參觀者的提問,及根據其興趣智能推薦參觀路線等。產品未來將繼續賦能文化產業運營,提升留存轉化。

商湯科技和敦煌當代美術館聯合推出的AI 智能講解器「AI問客」,是專為文旅場景打造的AI智能講解軟硬件一體產品,包含基於商湯日日新多模態大模型的智能系統,以及靈宇宙小方機等多種智能硬件,可為參觀者提供「可感知、會思考、有溫度」的Al講解敍事伴侶,重構傳統的導覽體驗。

更多相片

img_06

img_06

參觀者使用AI問客講解器

參觀者使用AI問客講解器

兒童使用AI問客小方機講解器

兒童使用AI問客小方機講解器

「AI問客」具備拍照講解功能

「AI問客」具備拍照講解功能

內容推薦功能

內容推薦功能

系統會生成個性化報告

系統會生成個性化報告

以多模態互動與深度思考能力 重構傳統導覽體驗

敦煌當代美術館位於上海市楊浦區,透過展示敦煌世界遺產,探索現代中國藝術的歷史邏輯和傳統文化的當代轉譯。

img_06

img_06

現時正在展出的 2025年「登臨出世界」,以「塔」為探究焦點,彙聚了自東漢至元代跨越千年的20餘件珍貴文物,以及來自20餘件(組)當代創作,從歷史現場、建築式樣、文學意象與視覺藝術等多學科視角,展開對塔的多元觀察與理解。

參觀者使用AI問客講解器

參觀者使用AI問客講解器

「AI問客」成為參觀者「一對一」的全程智能旅伴,商湯日日新領先的「多模態思維鏈」技術,讓「AI問客」擁有強大的多模態(同時理解文字、影片、圖像、聲音等資料)互動與深度思考能力。參觀者可以隨時停下來,反覆問問題,透過「語音+視覺+文字」結合的方式與AI 導遊對話,自行掌握逛展節奏。

兒童使用AI問客小方機講解器

兒童使用AI問客小方機講解器

AI 問客全程陪伴讓游客從「打卡式」到「深度體驗」

逛展期間,當遊客看到感興趣的展品,只需要拍攝照片,「AI問客」就能自動識別,生動講述文物背後的歷史典故和科學知識。

「AI問客」具備拍照講解功能

「AI問客」具備拍照講解功能

聽完講解後,參觀者還可以對著設備進行一對一語音提問,無論是深入探討文物背後的歷史淵源,還是追問某個藝術細節的創作緣起,都能即時獲得回應。

內容推薦功能

內容推薦功能

若還想知道專家怎麼說,只要點擊「館長說」,就能收到來自敦煌當代美術館杜館長從自身角度,對每一件展品、每一份作品的精彩闡釋,進一步了解作品的深意與價值。參觀者還可以任意選擇講解聲音和風格,例如「潮流聲」、「懷舊調」或者「萌語調」。

系統會生成個性化報告

系統會生成個性化報告

參觀結束後,參觀者還可以在系統中生成自己專屬的「AI觀展報告」,包含瀏覽參觀時長、問答次數等數據,了解自己是熱衷於「打卡」的靈魂攝影師,或熱愛鑽研的學術達人,並獲得獨特的個性標簽。

商湯「AI問客」以多模態智能為核心技術路徑,還整合了虛擬 IP 迎賓、AR體驗、熱點觀展問答、智能講解路線推薦等功能,可廣泛用於美術館、博物館、文旅景區、文化園區、活動賽事等場景,帶來革新的互動體驗和展現方式。

產品未來將繼續賦能文化產業運營,助力各場館、景區的運營方實現從「人力成本中心」到「數據驅動决策」的運營模式升級,最終幫助實現精準運營,提升留存轉化。

商湯科技今日發佈及開源原生理解生成統一模型日日新 SenseNova U1 系列。該系列基於商湯於今年三月自主研發的 NEO-unify 架構,在單一模型架構上統一了多模態理解、推理與生成。SenseNova U1 系列模型實現語言和視覺訊息的高效協同,讓理解與生成能力同步增强,既保持語義豐富度,亦維持像素級視覺保真度,可用於生成複雜的訊息圖(infographics),亦是業內首個實現連續性圖文創作輸出的模型。

在邏輯推理與空間智能等範疇,SenseNova U1 系列亦能深度理解物理世界的複雜佈局與精細關係,未來可為機器人提供具身大腦,於單一模型閉環內完成環境感知、邏輯推演到精準任務執行的全流程,為技術與產業發展提供重要基礎與關鍵引擎。

傳統多模態模型往往依靠「拼接」方式,把視覺編碼器(VE)和語言骨幹透過適配器串聯起來。此設計猶如一個「說不同語言的工作小組」,各成員分別負責看圖、把圖像翻譯成文字、理解文字、進行推理、把結果翻譯成設計指令,及畫出圖像;每需要完成一項任務,訊息都要在不同成員之間來回傳遞,既費時,也造成誤解和訊息損耗,故往往需要更大參數的模型,才能彌補不足。

Neo-unify 架構突破此限制,捨棄了主流的拼接方式,去除了 VE 和變分自編碼器(VAE),重新構建了統一的表徵空間。建基於 Neo-unify 的 SenseNova U1,猶如一個同時掌握多項技能的人,無需先看懂圖像,再翻譯成文字、交給另一個系統理解,而是在同一套「思考方式」中直接處理圖像、文字等不同訊息;圖像和語言不再由兩套系統「接力」,而是在同一個大腦中自然融合,可以減少訊息損耗,也能在相對精簡的模型規模下,高效實現更强的多模態理解與生成能力。

本次開源發佈的為 SenseNova U1 的輕量版系列 SenseNova U1 Lite,包含兩個不同規格:

• SenseNova-U1-8B-MoT:基於稠密骨幹網絡

• SenseNova-U1-A3B-MoT:基於混合專家(MoE)骨幹網絡

「以小博大」:模型規模小、效率高 性能媲美商用模型

多項基準測試成績印證 SenseNova U1 Lite 系列的優勢,在涵蓋圖像理解、圖像生成與編輯、空間智能及視覺推理的多項基準測試中,SenseNova U1 Lite 系列達到同量級開源模型的領先水平,為統一多模態理解與生成樹立新標竿。

SenseNova U1 Lite 憑 8B MoT 的小規格模型,已能達到、甚至超越部分大型商業閉源模型的表現,在各個維度和多個領域中展現優勢,體現「以小博大」。

在通用的圖像生成測試中,SenseNova U1 Lite 的圖像生成質量媲美 Qwen-Image 2.0 Pro 或 Seedream 4.5 等大型閉源模型,達到商業級水準,並在推理響應速度上有顯著優勢。

即使在極具挑戰性、開源模型能力長期受限的複雜訊息圖生成任務中,SenseNova U1 Lite 也逹致商業級水準,對處理複雜訊息圖的排版和文字具備强大的掌控力。

首創連續性圖文創作輸出

此外,憑藉 NEO-unify 架構的獨特優勢,SenseNova U1 成為業內首個實現連續性圖文創作輸出的模型。依托原生圖文理解與生成能力,模型可以將圖、文底層融合信號完整地保留在上下文之中,令生成圖像的風格高度連貫,並能在統一表徵空間進行高效連貫思考。同時,用戶只需透過單次、單模型調用,即可生成更高質量的作品,相比傳統模式,大大提升效率。

SenseNova U1 Lite 系列已全面開源,用戶可在以下平台部署使用及在線體驗:

• 開源部署:

• GitHub:https://github.com/OpenSenseNova/SenseNova-U1

• Hugging Face:https://huggingface.co/collections/sensenova/sensenova-u1

• 調用 SenseNova U1 Skill:https://github.com/OpenSenseNova/SenseNova-Skills

• 在線體驗及接入:即將賦能商湯辦公智能助手「辦公小浣熊」

商湯科技將沿著當前技術路徑擴展,並計劃推出更大規模的模型,有望以遠低於傳統的計算成本,達到國際頂尖模型的水平。

商湯亦深信原生統一的多模態智能是通往 AGI 的必經之路,公司將持續推動開源生態建設,並計劃推出更大參數規模的 U1 系列模型,同時歡迎社區用戶和開發者為模型提供寶貴意見。

• Discord (SenseNova-U1-Lite 專屬群): https://discord.gg/cxkwXWjp

SenseNova U1 Lite 實際應用例子:展現商業級的複雜訊息圖生成能力

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 實際應用例子:通過連貫、高保真度的圖文交錯思考輸出

連貫圖文創作

連貫圖文創作

任務一:五成熟牛扒烹調方法 任務二:繪製一個鋼鐵人圖案

SenseNova U1 可通過思考與規劃,能自動輸出分步流程及對應圖像,圖像風格保持高度一致性。

任務一演示

任務一演示

SenseNova U1 從掃描草稿起步,逐步推進創作,最終生成完成度極高的圖像。每一步的輸出都精準延續前一步的結構與細節;統一表徵的共享上下文在其中發揮了關鍵作用。

任務二演示

任務二演示

SenseNova U1 Lite 在基準測試表現優越

圖像生成質量基準測試

圖像生成質量基準測試

在通用的圖像生成測試中,SenseNova U1 Lite 不但在圖像生成質量上媲美 Qwen Image 2.0 Pro 或 Seedream 4.5 等大型閉源模型,達到商業級水準,還在推理響應速度上有顯著優勢。

複雜訊息圖生成基準測試

複雜訊息圖生成基準測試

即使在極具挑戰性、開源模型能力長期受限的複雜訊息圖生成任務中,SenseNova U1 Lite 也逹致商業級水準,對處理複雜訊息圖的排版和文字具備强大的掌控力。

你 或 有 興 趣 的 文 章