商湯科技聯上海敦煌當代美術館推「AI 智能講解器」革新導覽體驗

BasTech

商湯科技聯上海敦煌當代美術館推「AI 智能講解器」革新導覽體驗

2025年09月22日 17:42 最後更新：17:47

商湯科技為上海敦煌當代美術館的「登臨出世界」展覽提供「多模態智慧導覽」，參觀者只要拍攝場內展品，AI導遊就能自動辨識，講述文物背後的藝術脈絡、歷史淵源和科學知識，還可以實時回應參觀者的提問，及根據其興趣智能推薦參觀路線等。產品未來將繼續賦能文化產業運營，提升留存轉化。

商湯科技和敦煌當代美術館聯合推出的AI 智能講解器「AI問客」，是專為文旅場景打造的AI智能講解軟硬件一體產品，包含基於商湯日日新多模態大模型的智能系統，以及靈宇宙小方機等多種智能硬件，可為參觀者提供「可感知、會思考、有溫度」的Al講解敍事伴侶，重構傳統的導覽體驗。

點擊看圖輯

img_06

參觀者使用AI問客講解器

兒童使用AI問客小方機講解器

「AI問客」具備拍照講解功能

內容推薦功能

系統會生成個性化報告

以多模態互動與深度思考能力重構傳統導覽體驗

敦煌當代美術館位於上海市楊浦區，透過展示敦煌世界遺產，探索現代中國藝術的歷史邏輯和傳統文化的當代轉譯。

現時正在展出的 2025年「登臨出世界」，以「塔」為探究焦點，彙聚了自東漢至元代跨越千年的20餘件珍貴文物，以及來自20餘件(組)當代創作，從歷史現場、建築式樣、文學意象與視覺藝術等多學科視角，展開對塔的多元觀察與理解。

「AI問客」成為參觀者「一對一」的全程智能旅伴，商湯日日新領先的「多模態思維鏈」技術，讓「AI問客」擁有強大的多模態(同時理解文字、影片、圖像、聲音等資料)互動與深度思考能力。參觀者可以隨時停下來，反覆問問題，透過「語音+視覺+文字」結合的方式與AI 導遊對話，自行掌握逛展節奏。

AI 問客全程陪伴讓游客從「打卡式」到「深度體驗」

逛展期間，當遊客看到感興趣的展品，只需要拍攝照片，「AI問客」就能自動識別，生動講述文物背後的歷史典故和科學知識。

聽完講解後，參觀者還可以對著設備進行一對一語音提問，無論是深入探討文物背後的歷史淵源，還是追問某個藝術細節的創作緣起，都能即時獲得回應。

若還想知道專家怎麼說，只要點擊「館長說」，就能收到來自敦煌當代美術館杜館長從自身角度，對每一件展品、每一份作品的精彩闡釋，進一步了解作品的深意與價值。參觀者還可以任意選擇講解聲音和風格，例如「潮流聲」、「懷舊調」或者「萌語調」。

參觀結束後，參觀者還可以在系統中生成自己專屬的「AI觀展報告」，包含瀏覽參觀時長、問答次數等數據，了解自己是熱衷於「打卡」的靈魂攝影師，或熱愛鑽研的學術達人，並獲得獨特的個性標簽。

商湯「AI問客」以多模態智能為核心技術路徑，還整合了虛擬 IP 迎賓、AR體驗、熱點觀展問答、智能講解路線推薦等功能，可廣泛用於美術館、博物館、文旅景區、文化園區、活動賽事等場景，帶來革新的互動體驗和展現方式。

產品未來將繼續賦能文化產業運營，助力各場館、景區的運營方實現從「人力成本中心」到「數據驅動决策」的運營模式升級，最終幫助實現精準運營，提升留存轉化。

往下看更多文章

商湯發佈開源SenseNova U1 模型 8B小模型生成商業級訊息圖及連續性圖文

商湯科技今日發佈及開源原生理解生成統一模型日日新 SenseNova U1 系列。該系列基於商湯於今年三月自主研發的 NEO-unify 架構，在單一模型架構上統一了多模態理解、推理與生成。SenseNova U1 系列模型實現語言和視覺訊息的高效協同，讓理解與生成能力同步增强，既保持語義豐富度，亦維持像素級視覺保真度，可用於生成複雜的訊息圖（infographics），亦是業內首個實現連續性圖文創作輸出的模型。

在邏輯推理與空間智能等範疇，SenseNova U1 系列亦能深度理解物理世界的複雜佈局與精細關係，未來可為機器人提供具身大腦，於單一模型閉環內完成環境感知、邏輯推演到精準任務執行的全流程，為技術與產業發展提供重要基礎與關鍵引擎。

傳統多模態模型往往依靠「拼接」方式，把視覺編碼器（VE）和語言骨幹透過適配器串聯起來。此設計猶如一個「說不同語言的工作小組」，各成員分別負責看圖、把圖像翻譯成文字、理解文字、進行推理、把結果翻譯成設計指令，及畫出圖像；每需要完成一項任務，訊息都要在不同成員之間來回傳遞，既費時，也造成誤解和訊息損耗，故往往需要更大參數的模型，才能彌補不足。

Neo-unify 架構突破此限制，捨棄了主流的拼接方式，去除了 VE 和變分自編碼器（VAE），重新構建了統一的表徵空間。建基於 Neo-unify 的 SenseNova U1，猶如一個同時掌握多項技能的人，無需先看懂圖像，再翻譯成文字、交給另一個系統理解，而是在同一套「思考方式」中直接處理圖像、文字等不同訊息；圖像和語言不再由兩套系統「接力」，而是在同一個大腦中自然融合，可以減少訊息損耗，也能在相對精簡的模型規模下，高效實現更强的多模態理解與生成能力。

本次開源發佈的為 SenseNova U1 的輕量版系列 SenseNova U1 Lite，包含兩個不同規格：

• SenseNova-U1-8B-MoT：基於稠密骨幹網絡

• SenseNova-U1-A3B-MoT：基於混合專家（MoE）骨幹網絡

「以小博大」：模型規模小、效率高性能媲美商用模型

多項基準測試成績印證 SenseNova U1 Lite 系列的優勢，在涵蓋圖像理解、圖像生成與編輯、空間智能及視覺推理的多項基準測試中，SenseNova U1 Lite 系列達到同量級開源模型的領先水平，為統一多模態理解與生成樹立新標竿。

SenseNova U1 Lite 憑 8B MoT 的小規格模型，已能達到、甚至超越部分大型商業閉源模型的表現，在各個維度和多個領域中展現優勢，體現「以小博大」。

在通用的圖像生成測試中，SenseNova U1 Lite 的圖像生成質量媲美 Qwen-Image 2.0 Pro 或 Seedream 4.5 等大型閉源模型，達到商業級水準，並在推理響應速度上有顯著優勢。

即使在極具挑戰性、開源模型能力長期受限的複雜訊息圖生成任務中，SenseNova U1 Lite 也逹致商業級水準，對處理複雜訊息圖的排版和文字具備强大的掌控力。

首創連續性圖文創作輸出

此外，憑藉 NEO-unify 架構的獨特優勢，SenseNova U1 成為業內首個實現連續性圖文創作輸出的模型。依托原生圖文理解與生成能力，模型可以將圖、文底層融合信號完整地保留在上下文之中，令生成圖像的風格高度連貫，並能在統一表徵空間進行高效連貫思考。同時，用戶只需透過單次、單模型調用，即可生成更高質量的作品，相比傳統模式，大大提升效率。

SenseNova U1 Lite 系列已全面開源，用戶可在以下平台部署使用及在線體驗：

• 開源部署：

• GitHub：https://github.com/OpenSenseNova/SenseNova-U1

• Hugging Face：https://huggingface.co/collections/sensenova/sensenova-u1

• 調用 SenseNova U1 Skill：https://github.com/OpenSenseNova/SenseNova-Skills

• 在線體驗及接入：即將賦能商湯辦公智能助手「辦公小浣熊」

商湯科技將沿著當前技術路徑擴展，並計劃推出更大規模的模型，有望以遠低於傳統的計算成本，達到國際頂尖模型的水平。

商湯亦深信原生統一的多模態智能是通往 AGI 的必經之路，公司將持續推動開源生態建設，並計劃推出更大參數規模的 U1 系列模型，同時歡迎社區用戶和開發者為模型提供寶貴意見。

• Discord （SenseNova-U1-Lite 專屬群）: https://discord.gg/cxkwXWjp