Skip to Content Facebook Feature Image

理大AI突破大幅降成本 分散式訓練助全球科研普及

BasTech

理大AI突破大幅降成本 分散式訓練助全球科研普及
BasTech

BasTech

理大AI突破大幅降成本 分散式訓練助全球科研普及

2025年10月24日 14:16 最後更新:14:16

香港理工大學(理大)人工智能高等研究院(PAAI)研究團隊在生成式人工智能(GenAI)領域取得多項關鍵技術突破。團隊創新提出「協作式生成人工智能(Co-Generative AI)」模式,將 AI 訓練從傳統集中式轉向分散式,不僅大幅降低訓練成本、保障數據隱私,更打破資源壁壘,讓全球更多研究機構得以參與 AI 研發,為全球人工智能創新注入強勁動力。

當前,GenAI領域面臨三重核心制約:基礎模型訓練需耗費巨量計算資源,僅少數機構可以負擔,導致學術界難以直接參與基礎模型的訓練、領域專屬知識與數據無法融入模型;隱私保護與版權歸屬問題使醫療、金融等敏感數據難以用於訓練;基礎模型難以及時吸收新知識,每次重新訓練需「天文數字級」資源,嚴重阻礙技術迭代。針對這些痛點,理大 PAAI 團隊從「低成本訓練」與「分散式融合」兩大方向展開攻關,在理論証明和應用落地方面取得突破性成果。

理大成為業界首個開源發布「端到端 FP8 低比特訓練全套方案」(涵蓋預訓練及後訓練)的大學團隊,該技術打破全球基礎模型以BF16精度訓練的主流格局,是全球少數掌握該核心技術的研究團隊之一。與 BF16相比,FP8核心優勢體現在多方面:訓練速度提高逾兩成、顯存峰值佔用減少逾一成、成本大幅下降;整合「持續預訓練」、「監督式微調」和「強化學習」,訓練效果媲美 BF16模型且訓練時間和顯存佔用進一步壓縮。團隊已啟動更低成本的 FP4 精度訓練探索,相關成果已發表於學術論文;經測試,其在醫療的診斷和推理上超過目前業界發布同等尺寸最優模型領域;在科研智能體領域(Research Agent)中的任務複雜度,泛化能力和生成報告質量上均取得重大突破。

傳統基礎模型遵循「縮放定律」(參數越多、知識越廣、性能越強),但集中式訓練需耗費百萬計 GPU 小時,僅少數機構可以負擔。理大團隊研發的「InfiFusion 模型融合技術」則實現關鍵突破:僅需數百 GPU 小時,即可融合出傳統需 100萬至200萬 GPU 小時訓練的大模型;團隊更以實例驗證效率————用 160個 GPU 小時完成4個尖端模型融合,不僅避免了單個尖端模型傳統訓練需要的百萬級 GPU 小時,且融合後模型在多項權威測試中性能顯著優於原始模型。

此外,這項由 Thinking Machines Lab 非常倡導模型融合的理念,被理大團隊首次從理論上驗證了可行性。研究團隊通過嚴謹的數學推導,提出了「模型融合縮放定律」(Model Merging Scaling Law),這意味著通往通用人工智能 (AGI) 可能還有另一條途徑。理大 PAAI 執行院長、計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞教授指出:「以超低資源實現基礎模型訓練,加上高效模型融合,可助全球學術人員投入 GenAI 研究,匯聚更多力量創新。」

在技術落地層面,理大團隊已取得多領域實質進展。醫療領域中,團隊訓練出性能領先的醫療基礎大模型,並研發專屬「癌症 GenAI」—— 在同規模模型中性能最佳,可快速積累高質量醫療數據、直接對接醫療設備,用於癌症個性化治療規劃,目前正聯合復旦大學附屬華山醫院、中山大學腫瘤防治中心、山東省腫瘤醫院及香港伊利沙伯醫院推動合作與臨床落地。此外,團隊在智能體 AI(Agentic AI)領域亦有突破,該技術可作為研究生學術助手協助論文撰寫與審閱,同時作為多模態專利檢索引擎為創新研發提供高效支持。

理大高級副校長(研究及創新)趙汝恒教授表示:「人工智能是加速培育新質生產力的核心,理大新成立的 PAAI 致力加速人工智能技術在各個重點領域的深度融合,並針對不同行業開發具備專業領域知識的人工智能模型。此舉不但能鞏固理大在相關領域的領先地位,更將助力推動香港成為全球生成式人工智能發展的樞紐。」

楊紅霞教授領導的研究項目分別獲得研究資助局「2025/26 年度主題研究計劃」、香港特區政府創新科技署「產學研 1+計劃」及數碼港「人工智能資助計劃」資助,標誌香港在全球 AI創新領域邁出堅實步伐,為AI技術普惠化與產業落地注入新動能。

香港理工大學高級副校長(研究及創新)趙汝恒教授(左)與PAAI執行院長、計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞教授(右)出席新聞發布會。

香港理工大學高級副校長(研究及創新)趙汝恒教授(左)與PAAI執行院長、計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞教授(右)出席新聞發布會。

趙汝恒教授指,理大新成立的PAAI致力加速人工智能技術在各個重點領域的深度融合,冀鞏固理大在相關領域的領先地位,並助力推動香港成為全球生成式人工智能發展的樞紐。

趙汝恒教授指,理大新成立的PAAI致力加速人工智能技術在各個重點領域的深度融合,冀鞏固理大在相關領域的領先地位,並助力推動香港成為全球生成式人工智能發展的樞紐。

楊紅霞教授表示,團隊創新提出的「協作式生成人工智能」模式可助全球學術人員投入GenAI研究,匯聚更多力量創新。

楊紅霞教授表示,團隊創新提出的「協作式生成人工智能」模式可助全球學術人員投入GenAI研究,匯聚更多力量創新。

香港理工大學 (理大) 科研團隊在智能材料領域取得革命性突破,成功研發出可在人體安全磁場下,靈活變形並調控機械特性的柔軟磁流變紡織品。該物料以電力驅動、支持編程控制,同時兼具輕量、柔韌和透氣的紡織特性,可廣泛應用於智能穿戴、柔性機械人、虛擬實境 (VR) 和元宇宙虛擬觸感體驗等領域。

這種軟磁聚合物複合纖維以電力驅動、支持編程控制,同時兼具輕量、柔韌和透氣的紡織特性。

這種軟磁聚合物複合纖維以電力驅動、支持編程控制,同時兼具輕量、柔韌和透氣的紡織特性。

傳統磁流變材料長期受制於兩大瓶頸:磁粉笨重和高強度磁場對人體健康構成潛在風險。帶領該研究的理大智能可穿戴系統研究院院長、吳文政及王月娥紡織科技教授兼時裝及紡織學院紡織科技講座教授陶肖明教授指出:「研究團隊的核心目標是打破傳統磁流變技術的應用局限,拓展至纖維形式,既具精準智能調控,又能兼容紡織材料輕柔透氣的特性。」

香港理工大學陶肖明教授(左)及蒲俊宏博士(右)帶領的研究團隊研發可在人體安全磁場下靈活變形並調控機械特性的柔軟磁流變紡織品

香港理工大學陶肖明教授(左)及蒲俊宏博士(右)帶領的研究團隊研發可在人體安全磁場下靈活變形並調控機械特性的柔軟磁流變紡織品

科研團隊創新研製的軟磁聚合物複合纖維,直徑僅 57 微米,通過在塑膠物料 (低密度聚乙烯基質) 中均勻分散磁粉,不僅實現低強度磁場下的精準控制,更解決磁粉沉重問題,又可進一步編織成紗線、多層面料,實現大面積可控變形。該突破性研究獲研資局「2024/25 年度主題研究計劃」資助 6,237 萬港元,並已於國際期刊《自然》上發表,題為「矢量刺激響應的磁流變纖維材料」。

研究團隊利用這種具備獨特方向性可控反應能力的嶄新纖維開發了多種創新物料。

研究團隊利用這種具備獨特方向性可控反應能力的嶄新纖維開發了多種創新物料。

不同於傳統僅對電壓、電流、溫度等「標量刺激」反應的智能材料,團隊研發的磁流變紡織品具備獨特的方向性可控反應能力,三大創新物料包括:

研究團隊開發的創新物料包括能通過電流控制剛度靈活抓起易碎或不規則形狀物品的柔性「靈巧抓」。

研究團隊開發的創新物料包括能通過電流控制剛度靈活抓起易碎或不規則形狀物品的柔性「靈巧抓」。

• 柔性「靈巧抓」: 通過電流控制剛度,可如人類手指般靈活抓起易碎、豆腐、藍莓、綠豆糕、薯片和螺旋面等軟質、易碎或不規則形狀物品,大輻降低操作過程中的損壞或變形風險。

研究團隊開發的創新物料包括可精準模擬不同物體的表面紋理與觸感硬度的遙距仿真手感指套。

研究團隊開發的創新物料包括可精準模擬不同物體的表面紋理與觸感硬度的遙距仿真手感指套。

• 遙距仿真手感指套: 全織物材可精準模擬不同物體的表面紋理與觸感硬度,佩戴更輕便舒適,適用於遠程手術培訓、中風康復訓練、虛擬試衣等多元場景,彌補市面同類觸覺手套普遍存在過大和過重的不足。

研究團隊開發的創新物料包括通過電控磁場驅動纖維結構變形實現透氣量智能調節的主動通風調溫織物。

研究團隊開發的創新物料包括通過電控磁場驅動纖維結構變形實現透氣量智能調節的主動通風調溫織物。

• 主動通風調溫織物: 針對紡織服裝的濕熱管理痛點,通過電控磁場驅動纖維結構變形,實現透氣量智能調節,顯著提升穿戴溫濕舒適度。

談及技術創新性,陶肖明教授解釋:「本研究的關鍵突破在於首次將傳統剛性磁性裝置轉化為柔性替代品,更可延伸至硬磁性纖維材料研發,為新一代柔性機械人、電磁裝置及可穿戴技術的研發奠定基礎。」

對於產業化前景,團隊成員、時裝及紡織學院助理教授(研究)蒲俊宏博士補充:「從原材料選擇到處理工藝,我們都考慮了產業化需求,採用已實現大規模量產的商品級原料,且處理工藝成熟,為技術快速落地食品生產、醫療康復、元宇宙交互等領域應用奠下基礎。」

你 或 有 興 趣 的 文 章