商湯發佈開源SenseNova U1 模型 8B小模型生成商業級訊息圖及連續性圖文

Skip to Content Facebook Feature Image

Facebook Feature Image

商湯發佈開源SenseNova U1 模型 8B小模型生成商業級訊息圖及連續性圖文

BasTech

BasTech

商湯發佈開源SenseNova U1 模型 8B小模型生成商業級訊息圖及連續性圖文

2026年04月29日 13:02 最後更新：13:15

商湯科技今日發佈及開源原生理解生成統一模型日日新 SenseNova U1 系列。該系列基於商湯於今年三月自主研發的 NEO-unify 架構，在單一模型架構上統一了多模態理解、推理與生成。SenseNova U1 系列模型實現語言和視覺訊息的高效協同，讓理解與生成能力同步增强，既保持語義豐富度，亦維持像素級視覺保真度，可用於生成複雜的訊息圖（infographics），亦是業內首個實現連續性圖文創作輸出的模型。

在邏輯推理與空間智能等範疇，SenseNova U1 系列亦能深度理解物理世界的複雜佈局與精細關係，未來可為機器人提供具身大腦，於單一模型閉環內完成環境感知、邏輯推演到精準任務執行的全流程，為技術與產業發展提供重要基礎與關鍵引擎。

點擊看圖輯

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

連貫圖文創作

任務一演示

任務二演示

圖像生成質量基準測試

複雜訊息圖生成基準測試

更多相片

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

SenseNova U1 Lite 訊息圖生成

連貫圖文創作

任務一演示

任務二演示

圖像生成質量基準測試

複雜訊息圖生成基準測試

傳統多模態模型往往依靠「拼接」方式，把視覺編碼器（VE）和語言骨幹透過適配器串聯起來。此設計猶如一個「說不同語言的工作小組」，各成員分別負責看圖、把圖像翻譯成文字、理解文字、進行推理、把結果翻譯成設計指令，及畫出圖像；每需要完成一項任務，訊息都要在不同成員之間來回傳遞，既費時，也造成誤解和訊息損耗，故往往需要更大參數的模型，才能彌補不足。

Neo-unify 架構突破此限制，捨棄了主流的拼接方式，去除了 VE 和變分自編碼器（VAE），重新構建了統一的表徵空間。建基於 Neo-unify 的 SenseNova U1，猶如一個同時掌握多項技能的人，無需先看懂圖像，再翻譯成文字、交給另一個系統理解，而是在同一套「思考方式」中直接處理圖像、文字等不同訊息；圖像和語言不再由兩套系統「接力」，而是在同一個大腦中自然融合，可以減少訊息損耗，也能在相對精簡的模型規模下，高效實現更强的多模態理解與生成能力。

本次開源發佈的為 SenseNova U1 的輕量版系列 SenseNova U1 Lite，包含兩個不同規格：

• SenseNova-U1-8B-MoT：基於稠密骨幹網絡

• SenseNova-U1-A3B-MoT：基於混合專家（MoE）骨幹網絡

「以小博大」：模型規模小、效率高性能媲美商用模型

多項基準測試成績印證 SenseNova U1 Lite 系列的優勢，在涵蓋圖像理解、圖像生成與編輯、空間智能及視覺推理的多項基準測試中，SenseNova U1 Lite 系列達到同量級開源模型的領先水平，為統一多模態理解與生成樹立新標竿。

SenseNova U1 Lite 憑 8B MoT 的小規格模型，已能達到、甚至超越部分大型商業閉源模型的表現，在各個維度和多個領域中展現優勢，體現「以小博大」。

在通用的圖像生成測試中，SenseNova U1 Lite 的圖像生成質量媲美 Qwen-Image 2.0 Pro 或 Seedream 4.5 等大型閉源模型，達到商業級水準，並在推理響應速度上有顯著優勢。

即使在極具挑戰性、開源模型能力長期受限的複雜訊息圖生成任務中，SenseNova U1 Lite 也逹致商業級水準，對處理複雜訊息圖的排版和文字具備强大的掌控力。

首創連續性圖文創作輸出

此外，憑藉 NEO-unify 架構的獨特優勢，SenseNova U1 成為業內首個實現連續性圖文創作輸出的模型。依托原生圖文理解與生成能力，模型可以將圖、文底層融合信號完整地保留在上下文之中，令生成圖像的風格高度連貫，並能在統一表徵空間進行高效連貫思考。同時，用戶只需透過單次、單模型調用，即可生成更高質量的作品，相比傳統模式，大大提升效率。

SenseNova U1 Lite 系列已全面開源，用戶可在以下平台部署使用及在線體驗：

• 開源部署：

• GitHub：https://github.com/OpenSenseNova/SenseNova-U1

• Hugging Face：https://huggingface.co/collections/sensenova/sensenova-u1

• 調用 SenseNova U1 Skill：https://github.com/OpenSenseNova/SenseNova-Skills

• 在線體驗及接入：即將賦能商湯辦公智能助手「辦公小浣熊」

商湯科技將沿著當前技術路徑擴展，並計劃推出更大規模的模型，有望以遠低於傳統的計算成本，達到國際頂尖模型的水平。

商湯亦深信原生統一的多模態智能是通往 AGI 的必經之路，公司將持續推動開源生態建設，並計劃推出更大參數規模的 U1 系列模型，同時歡迎社區用戶和開發者為模型提供寶貴意見。

• Discord （SenseNova-U1-Lite 專屬群）: https://discord.gg/cxkwXWjp

SenseNova U1 Lite 實際應用例子：展現商業級的複雜訊息圖生成能力

SenseNova U1 Lite 實際應用例子：通過連貫、高保真度的圖文交錯思考輸出

任務一：五成熟牛扒烹調方法 任務二：繪製一個鋼鐵人圖案

SenseNova U1 可通過思考與規劃，能自動輸出分步流程及對應圖像，圖像風格保持高度一致性。

SenseNova U1 從掃描草稿起步，逐步推進創作，最終生成完成度極高的圖像。每一步的輸出都精準延續前一步的結構與細節；統一表徵的共享上下文在其中發揮了關鍵作用。

SenseNova U1 Lite 在基準測試表現優越

在通用的圖像生成測試中，SenseNova U1 Lite 不但在圖像生成質量上媲美 Qwen Image 2.0 Pro 或 Seedream 4.5 等大型閉源模型，達到商業級水準，還在推理響應速度上有顯著優勢。

即使在極具挑戰性、開源模型能力長期受限的複雜訊息圖生成任務中，SenseNova U1 Lite 也逹致商業級水準，對處理複雜訊息圖的排版和文字具備强大的掌控力。

往下看更多文章

全港首隻AI賦能投資公募基金面世商湯提供產業投研支持

商湯集團（0020.HK）近日宣佈，將為招銀國際推出的全港首隻 AI 賦能投資 AI 主題主動權益公募基金提供產業投研賦能。此舉旨在為投資者提供一款能更精準捕捉人工智能產業變革機遇的投資工具，並降低專業 AI 投資的門檻。

順勢而為把握長期機遇

人工智能被視為已越過「工業紅線」，成為一輪具有長期性、系統性及全球性的重大投資機遇。招銀國際此次推出的 AI 股票基金，正是聚焦於人工智能產業鏈的核心投資機會，致力打造一個清晰、穩健且可持續的投資框架，幫助投資者把握 AI 時代的長期成長紅利。

該基金將系統性佈局 AI 價值鏈，重點投資於真正處於價值核心、並深度受益於 AI 發展的優質企業。作為香港公募基金產品，其意義在於以相對普惠的方式，讓 AI 投資機會從少數專業投資者的領域，轉化為更廣泛投資者可參與的長期配置方向。

專業賦能強化投研視角

在產品框架中，商湯集團將為該基金的投研體系提供產業領先的視角與支持。憑藉其在 AI 領域的技術積累與產業洞察，商湯的賦能有助於基金更高效地跟蹤 AI 產業鏈的演進，識別關鍵技術與商業化趨勢的變化，從而強化整體投研支撐能力。

商湯科技董事長兼 CEO 徐立表示：「商湯和招銀國際的這次合作，是讓 AI 真正走進金融、走進產業的又一次務實嘗試。我們希望通過這隻基金，把原本複雜、高門檻、專業性很強的 AI 產業投資，轉化為普通投資者也能夠理解、能夠參與、能夠長期持有的產品選擇，讓更多人能夠分享人工智能時代的發展紅利。」

據悉，該基金為香港證券及期貨事務監察委員會認可及註冊的全港首隻同類產品。

你或有興趣的文章

商湯Seko平台助逾10萬創作者降動畫成本99.5%

商湯Seko平台助逾10萬創作者降動畫成本99.5%

商湯科技聯上海敦煌當代美術館推「AI 智能講解器」革新導覽體驗

商湯科技聯上海敦煌當代美術館推「AI 智能講解器」革新導覽體驗