Skip to Content Facebook Feature Image

DeepSeek V3更新!成本直降95% 預測準確性與性能大大提高

兩岸

DeepSeek V3更新!成本直降95%  預測準確性與性能大大提高
兩岸

兩岸

DeepSeek V3更新!成本直降95% 預測準確性與性能大大提高

2025年03月27日 12:20 最後更新:15:46

國產AI模型DeepSeek24日在「Hugging Face」平台上發布了「DeepSeek V3-0324」模型的更新。DeepSeek稱,這次更新能夠有效且準確地解決現實世界中的挑戰。

DeepSeek深夜突發V3更新

根據了解,「V3」模型是一款強大的混合專家(MoE)語言模型,擁有驚人的6710億個總參數。在處理每個token(如單詞或符號)時,該模型會動態選擇並啟動370億個參數進行計算。

模型保持高效性  且能提高預測準確性與性能

這種混合專家(MoE)技術的應用,不僅使得模型能夠高效運行,還能夠在保持高效性的同時,顯著提高預測準確性與性能。

AP圖片

AP圖片

訓練成本僅為557.6萬美元  成本直降95% 

就訓練成本而言,DeepSeek V3-0324展現出極高的成本效益,其訓練成本僅為557.6萬美元,遠低於傳統的閉源模型,節省了95%的成本。這一成本優勢使得DeepSeek V3不僅在技術上取得突破,也讓企業在實際應用中能夠大幅降低成本。

AP圖片

AP圖片

美國傳媒報道,中國人工智能模型(AI)DeepSeek開發新一代AI模型,使用了美國禁止向中國出口的Nvidia晶片。

DeepSeek開發新一代AI模型,據報使用了美國禁止向中國出口的Nvidia晶片。AP資料圖片

DeepSeek開發新一代AI模型,據報使用了美國禁止向中國出口的Nvidia晶片。AP資料圖片

報道引述消息人士說,Nvidia的Blackwell晶片銷售到獲准的國家,DeepSeek透露先拆解在伺服器的晶片,再運入中國,避免受到出口監控。

Nvidia發言人在一份聲明中說,公司未發現任何實質證據或收到任何線報,顯示存在報道所形容的情況,又說只要獲得任何線索都會作出追查。

圖片來源:英偉達官網

圖片來源:英偉達官網

DeepSeek未有回應外電的查詢。

美國總統特朗普日前宣佈批准向中國獲准的公司,出口Nvidia性能不是最強的H200晶片,並抽取25%費用。

你 或 有 興 趣 的 文 章