矽谷半導體公司 TetraMem 專注開發模擬記憶體內運算 (IMC) 方案,今日公布其 MLX200 平台已成功完成設計定案、製造,並初步驗證其22納米多級電阻式隨機存取記憶體 (RRAM) 模擬記憶體內運算系統單晶片 (SoC)。
這項成就標誌著基於新興非揮發性記憶體技術的模擬運算架構,邁向商業化的重要一步,有助應對現代人工智能系統中,數據傳輸、功耗及散熱限制日益嚴峻的挑戰。
MLX200 晶片照片,旁為五仙硬幣作大小參考 AP圖片
隨着人工智能工作負載持續擴展,系統效能日益受限於記憶體與運算單元之間數據傳輸的成本。模擬記憶體內運算提供截然不同的方法,直接在記憶體陣列內執行運算,大幅減少數據傳輸,並提升系統層面效率。TetraMem 的 MLX200 平台整合多級 RRAM 陣列與混合訊號運算引擎,可在記憶體內實現高吞吐量的向量矩陣運算,同時保持與先進互補式金屬氧化物半導體 (CMOS) 製程的兼容性。
台積電22納米製程展示的多級 RRAM 技術,具備實際部署所需的關鍵特性,包括與互補式金屬氧化物半導體 (CMOS) 兼容,且額外製程複雜性極低;低電壓及低電流操作;強勁的數據保留及耐用性;以及支援提升記憶體及運算密度的高多級能力。初步晶片測試結果顯示,陣列功能一致,證明此方法適用於嵌入式非揮發性記憶體及記憶體內運算應用。
這項里程碑建基於 TetraMem 早前在 MX100 平台上的工作。該平台採用台積電65納米互補式金屬氧化物半導體 (CMOS) 製程製造,公司曾展示具備數千個電導級別的多級 RRAM 裝置(《自然》雜誌2023年3月刊登的「集成於互補式金屬氧化物半導體上的憶阻器具備數千個電導級別」),以及高精度模擬運算能力(《科學》雜誌2024年2月刊登的「以任意高精度編程憶阻器陣列實現模擬運算」)。這些前期成果為將技術擴展至更先進節點,奠定堅實的科學及工程基礎。
自2019年起,TetraMem 一直與全球領先的半導體代工廠緊密合作,將 RRAM 技術從早期研究推進至可製造的晶片。22納米製程所取得的進展,反映製程整合、裝置均勻性及系統級協同設計的持續發展。
MLX200 及 MLX201 平台旨在支援對功耗及延遲敏感的邊緣人工智能應用,包括語音及音頻處理、可穿戴裝置、物聯網系統及持續感測。預計將於2026年下半年開始評估取樣,而多級 RRAM 記憶體知識產權 (IP) 現已可供評估及潛在授權。
TetraMem 聯合創辦人兼行政總裁葛林博士指出:「這項里程碑反映我們與代工夥伴台積電多年來的緊密合作,並展示將多級 RRAM 及模擬記憶體內運算,從運算架構突破帶入先進節點商業晶片的可行性。我們相信此方法為提升下一代人工智能系統的能源效率及可擴展性,提供切實可行的途徑。」
MLX200 平台的成功實現,突顯多級 RRAM 模擬運算在先進半導體製程上的可行性。TetraMem 將繼續推進這項技術,以支援新興人工智能工作負載,提升能源效率及系統可擴展性。
關於 TetraMem:TetraMem 是一間位於矽谷的半導體公司,利用多級 RRAM 技術開創模擬記憶體內運算。其架構整合記憶體與運算,大幅減少數據傳輸,並提升人工智能工作負載的能源效率。憑藉在裝置、電路及系統協同設計方面的堅實基礎,TetraMem 正推進邊緣人工智能及未來高效能運算的可擴展方案,並與領先的代工廠及生態系統夥伴緊密合作,將基礎科學突破技術帶入商業化量產。
(美聯社)