4月8日上午,人工智能公司DeepSeek在其網頁端及iOS應用程式的頁面出現更新,對話頁面新增「快速模式」與「專家模式」兩種選項。其中,快速模式標註為「適合日常對話,即時響應」,而專家模式則標註為「擅長複雜問題,高峯需等待」。兩種模式下,用户均可選擇是否開啟「深度思考」和「智能搜索」功能。
DeepSeek。AP資料圖片
專家模式專攻專業領域
此次推出的「專家模式」新增了編程、法律、醫學等多個領域的專業知識諮詢能力。業內人士分析認為,「專家模式」很可能使用了更大、更強的模型,極有可能是DeepSeek-V4正式版的某個形態。
DeepSeek推專家模式
DeepSeek-V4技術細節
資料顯示,DeepSeek-V4是由杭州深度求索人工智能基礎技術研究有限公司研製的大模型,為DeepSeek-V3的迭代版本,計劃於2026年發布。該模型專注於代碼生成能力,在超長代碼提示處理、數據模式理解與推理能力方面實現了技術突破,可支持數萬行代碼庫的上下文理解。模型採用了混合專家架構(MoE)和流形約束超連接(mHC)技術,總參數達6710億,推理激活參數為370億,並在訓練中應用了MLA多頭潛在注意力機制。
或與早前死機事件有關
在4月初,「DeepSeek死機」曾一度登上網絡熱搜。當時業內便有猜測,事件可能與DeepSeek-V4進行隱身測試有關,或意味著DeepSeek-V4的發布已臨近。