Skip to Content Facebook Feature Image

理大AI突破大幅降成本 分散式訓練助全球科研普及

BasTech

理大AI突破大幅降成本 分散式訓練助全球科研普及
BasTech

BasTech

理大AI突破大幅降成本 分散式訓練助全球科研普及

2025年10月24日 14:16 最後更新:14:16

香港理工大學(理大)人工智能高等研究院(PAAI)研究團隊在生成式人工智能(GenAI)領域取得多項關鍵技術突破。團隊創新提出「協作式生成人工智能(Co-Generative AI)」模式,將 AI 訓練從傳統集中式轉向分散式,不僅大幅降低訓練成本、保障數據隱私,更打破資源壁壘,讓全球更多研究機構得以參與 AI 研發,為全球人工智能創新注入強勁動力。

當前,GenAI領域面臨三重核心制約:基礎模型訓練需耗費巨量計算資源,僅少數機構可以負擔,導致學術界難以直接參與基礎模型的訓練、領域專屬知識與數據無法融入模型;隱私保護與版權歸屬問題使醫療、金融等敏感數據難以用於訓練;基礎模型難以及時吸收新知識,每次重新訓練需「天文數字級」資源,嚴重阻礙技術迭代。針對這些痛點,理大 PAAI 團隊從「低成本訓練」與「分散式融合」兩大方向展開攻關,在理論証明和應用落地方面取得突破性成果。

理大成為業界首個開源發布「端到端 FP8 低比特訓練全套方案」(涵蓋預訓練及後訓練)的大學團隊,該技術打破全球基礎模型以BF16精度訓練的主流格局,是全球少數掌握該核心技術的研究團隊之一。與 BF16相比,FP8核心優勢體現在多方面:訓練速度提高逾兩成、顯存峰值佔用減少逾一成、成本大幅下降;整合「持續預訓練」、「監督式微調」和「強化學習」,訓練效果媲美 BF16模型且訓練時間和顯存佔用進一步壓縮。團隊已啟動更低成本的 FP4 精度訓練探索,相關成果已發表於學術論文;經測試,其在醫療的診斷和推理上超過目前業界發布同等尺寸最優模型領域;在科研智能體領域(Research Agent)中的任務複雜度,泛化能力和生成報告質量上均取得重大突破。

傳統基礎模型遵循「縮放定律」(參數越多、知識越廣、性能越強),但集中式訓練需耗費百萬計 GPU 小時,僅少數機構可以負擔。理大團隊研發的「InfiFusion 模型融合技術」則實現關鍵突破:僅需數百 GPU 小時,即可融合出傳統需 100萬至200萬 GPU 小時訓練的大模型;團隊更以實例驗證效率————用 160個 GPU 小時完成4個尖端模型融合,不僅避免了單個尖端模型傳統訓練需要的百萬級 GPU 小時,且融合後模型在多項權威測試中性能顯著優於原始模型。

此外,這項由 Thinking Machines Lab 非常倡導模型融合的理念,被理大團隊首次從理論上驗證了可行性。研究團隊通過嚴謹的數學推導,提出了「模型融合縮放定律」(Model Merging Scaling Law),這意味著通往通用人工智能 (AGI) 可能還有另一條途徑。理大 PAAI 執行院長、計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞教授指出:「以超低資源實現基礎模型訓練,加上高效模型融合,可助全球學術人員投入 GenAI 研究,匯聚更多力量創新。」

在技術落地層面,理大團隊已取得多領域實質進展。醫療領域中,團隊訓練出性能領先的醫療基礎大模型,並研發專屬「癌症 GenAI」—— 在同規模模型中性能最佳,可快速積累高質量醫療數據、直接對接醫療設備,用於癌症個性化治療規劃,目前正聯合復旦大學附屬華山醫院、中山大學腫瘤防治中心、山東省腫瘤醫院及香港伊利沙伯醫院推動合作與臨床落地。此外,團隊在智能體 AI(Agentic AI)領域亦有突破,該技術可作為研究生學術助手協助論文撰寫與審閱,同時作為多模態專利檢索引擎為創新研發提供高效支持。

理大高級副校長(研究及創新)趙汝恒教授表示:「人工智能是加速培育新質生產力的核心,理大新成立的 PAAI 致力加速人工智能技術在各個重點領域的深度融合,並針對不同行業開發具備專業領域知識的人工智能模型。此舉不但能鞏固理大在相關領域的領先地位,更將助力推動香港成為全球生成式人工智能發展的樞紐。」

楊紅霞教授領導的研究項目分別獲得研究資助局「2025/26 年度主題研究計劃」、香港特區政府創新科技署「產學研 1+計劃」及數碼港「人工智能資助計劃」資助,標誌香港在全球 AI創新領域邁出堅實步伐,為AI技術普惠化與產業落地注入新動能。

香港理工大學高級副校長(研究及創新)趙汝恒教授(左)與PAAI執行院長、計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞教授(右)出席新聞發布會。

香港理工大學高級副校長(研究及創新)趙汝恒教授(左)與PAAI執行院長、計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞教授(右)出席新聞發布會。

趙汝恒教授指,理大新成立的PAAI致力加速人工智能技術在各個重點領域的深度融合,冀鞏固理大在相關領域的領先地位,並助力推動香港成為全球生成式人工智能發展的樞紐。

趙汝恒教授指,理大新成立的PAAI致力加速人工智能技術在各個重點領域的深度融合,冀鞏固理大在相關領域的領先地位,並助力推動香港成為全球生成式人工智能發展的樞紐。

楊紅霞教授表示,團隊創新提出的「協作式生成人工智能」模式可助全球學術人員投入GenAI研究,匯聚更多力量創新。

楊紅霞教授表示,團隊創新提出的「協作式生成人工智能」模式可助全球學術人員投入GenAI研究,匯聚更多力量創新。

由香港理工大學、香港城市大學及華中科技大學學者組成的聯合研究團隊,首次發現海膽棘刺內部的梯度多孔立體網狀骨架具有強大的機電感知能力,能迅速感應水流。團隊更利用3D打印技術,成功製造出仿生新材料傳感器,為傳感技術帶來重大突破。

由理大協理副校長(研究)、研究生院院長、郭氏集團仿生工程教授兼機械工程學系講座教授王鑽開教授帶領的研究團隊,首次發現海膽棘刺內部的梯度多孔結構具有強大機電感知能力,能在水流經過時產生電訊號,並利用3D打印技術製造仿生超材料傳感器。

由理大協理副校長(研究)、研究生院院長、郭氏集團仿生工程教授兼機械工程學系講座教授王鑽開教授帶領的研究團隊,首次發現海膽棘刺內部的梯度多孔結構具有強大機電感知能力,能在水流經過時產生電訊號,並利用3D打印技術製造仿生超材料傳感器。

研究團隊在刺冠海膽身上觀察到,當海水滴落在棘刺尖端時,棘刺會在一秒內迅速旋轉。電學測量發現,棘刺受水滴刺激後,內部會產生約百毫伏電壓;水流刺激也能產生約數十毫伏的電壓。這種機電感知能力在已死亡的棘刺中依然存在,證明相關機制與生物細胞無關。

研究團隊構建了一款3 × 3陣列仿生3D超材料機械傳感器,各組件均採用了仿海膽棘刺的梯度多孔結構,無需額外電源,即可在水下即時記錄電訊號,並精準定位水流衝擊位置。

研究團隊構建了一款3 × 3陣列仿生3D超材料機械傳感器,各組件均採用了仿海膽棘刺的梯度多孔結構,無需額外電源,即可在水下即時記錄電訊號,並精準定位水流衝擊位置。

這種反應源自棘刺內部的雙連續梯度多孔立體網狀骨架。該骨架由大小不一的孔洞組成,並沿棘刺的基部到尖端逐漸變化:基部孔洞較大、固體密度較低,尖端孔洞較小、固體密度較高。當水流經此多孔結構時,流液界面發生相互作用,流動液體對雙電層產生剪切作用,誘導界面電荷的分離和重新排佈,從而產生電壓差。梯度結構會令水流與孔壁的碰撞更劇烈,使電壓差更強,從而提升感知能力。

團隊觀察到,當海水滴落在海膽棘刺尖端時,棘刺會迅速旋轉。他們利用電學測量,發現棘刺受水滴刺激後,內部會產生約百毫伏電壓。

團隊觀察到,當海水滴落在海膽棘刺尖端時,棘刺會迅速旋轉。他們利用電學測量,發現棘刺受水滴刺激後,內部會產生約百毫伏電壓。

受此發現啟發,研究團隊利用光固化3D打印技術,以高分子聚合物和陶瓷製作出模仿棘刺結構的樣本。實驗證實,在水流刺激下,仿生梯度設計相較一般非梯度設計,電壓輸出高約三倍,訊號振幅更增約八倍,顯示機電感知能力的關鍵在於結構而非材料。

團隊更構建了一款3 × 3陣列仿生3D超材料機械傳感器,各組件均採用梯度多孔結構。該傳感器無需額外電源,即可在水下即時記錄電訊號,並精準定位水流衝擊位置。研究指出,海膽棘刺的梯度多孔結構強化了訊號傳遞,提升了傳感器的精準度及靈敏度。

這種強大的機電感知機制可以複製至不同材料,並有望延伸至感測水流以外的各種訊號,包括壓力、震動、電波等,啟發其他領域的傳感技術。例如在腦機接口中,可用以增強腦電波及神經訊號的傳遞。

海膽棘刺的機電感知能力源自其內部獨特的雙連續梯度多孔立體網狀骨架:由大小不一的孔洞組成,並沿棘刺的基部到尖端逐漸變化,基部孔洞較大、固體密度較低,尖端孔洞較小、固體密度較高。

海膽棘刺的機電感知能力源自其內部獨特的雙連續梯度多孔立體網狀骨架:由大小不一的孔洞組成,並沿棘刺的基部到尖端逐漸變化,基部孔洞較大、固體密度較低,尖端孔洞較小、固體密度較高。

領導研究的理大協理副校長(研究)、研究生院長王鑽開表示,相比傳統機械傳感器,團隊設計的仿生超材料傳感器在可生產性、結構設計可能性、材料通用性、幾何與性能控制能力及水下自我感測時間差能力等方面均更勝一籌。

研究團隊構建了一款3 × 3陣列仿生3D超材料機械傳感器,各組件均採用了仿海膽棘刺的梯度多孔結構,無需額外電源,即可在水下即時記錄電訊號,並精準定位水流衝擊位置。

研究團隊構建了一款3 × 3陣列仿生3D超材料機械傳感器,各組件均採用了仿海膽棘刺的梯度多孔結構,無需額外電源,即可在水下即時記錄電訊號,並精準定位水流衝擊位置。

王鑽開期望結合多孔結構的梯度與3D打印技術,以不同材料、孔徑及表面特徵來製造更多仿生超材料傳感器,在更多領域發揮應用潛力。他亦指出,對於天然多孔材料而言,強度等力學性能或許並非其核心功能,深入探索這些鮮為人知的生物機制,對推動仿生研究發展具有至關重要的意義。
 
此項聯合研究已刊登於國際頂尖學術期刊《自然》上。

你 或 有 興 趣 的 文 章