Skip to Content Facebook Feature Image

中國AI模型DeepSeek引發矽谷震盪 Meta緊急組建研究小組 美媒:制裁反而促進創新

博客文章

中國AI模型DeepSeek引發矽谷震盪 Meta緊急組建研究小組 美媒:制裁反而促進創新
博客文章

博客文章

中國AI模型DeepSeek引發矽谷震盪 Meta緊急組建研究小組 美媒:制裁反而促進創新

2025年01月27日 16:38 最後更新:16:47

一款中國AI模型,24小時內橫掃美國App Store榜單,連ChatGPT都被擠下神壇。DeepSeek的橫空出世,不僅讓矽谷巨頭Meta緊急組建研究小組,更證明了美國「制裁」或許正在催生中國在AI領域的「彎道超車」。

中國人工智能公司深度求索開發大模型DeepSeek-R1。AP圖片

中國人工智能公司深度求索開發大模型DeepSeek-R1。AP圖片

這兩天,中國人工智能公司深度求索開發的大模型DeepSeek-R1一經推出,憑借其「物美價廉」的特性在海外開發者社區中引發了轟動。

截至北京時間1月27日早,DeepSeek在美區蘋果App Store免費榜上已經排在第一位,力壓此前霸榜的ChatGPT。而就在昨天早上,DeepSeek還沒有擠進榜單前五,顯示出過去24小時發酵速度之快。在國區蘋果App Store免費榜,DeepSeek也已登頂。

DeepSeek已在蘋果App Store國區和美區免費榜登頂。

DeepSeek已在蘋果App Store國區和美區免費榜登頂。

據美國《華爾街日報》當地時間1月26日報道,DeepSeek-R1的出色表現已經給美國科技行業留下深刻印象,從業者紛紛稱贊深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美國試圖通過制裁限制中國的AI發展,但資源的限制反而激發了中國科研人員的創造力。

深度求索在1月20日發佈了DeepSeek-R1模型,該公司表示,DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,其性能比肩美國OpenAI o1正式版。

為促進技術社區的充分交流與創新協作,深度求索還公開了DeepSeek-R1訓練技術。

DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比較。DeepSeek微信公眾號

DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比較。DeepSeek微信公眾號

一些第三方測試結果也顯示,DeepSeek-R1的表現足以匹敵美國頂尖AI模型。美國加州大學伯克利分校研究人員設立的聊天機器人競技場(Chatbot Arena)平台上,DeepSeek-R1和去年12月發佈的DeepSeek-V3的性能表現均位列前十。

不僅如此,DeepSeek的開發成本和使用的算力規模都遠低於美國頂尖AI公司。先前發佈的DeepSeek-V3在僅使用2048顆英偉達H800 GPU的情況下,完成了6710億參數模型的訓練,成本約為560萬美元,這遠低於其他頂級模型的訓練成本。美媒指出,H800的算力要弱於英偉達H100等芯片,美國限制對華出口此類高性能芯片。

《華爾街日報》提到,作為對比,美國AI企業、Claude模型開發商Anthropic首席執行官達里奧·阿莫代伊(Dario Amodei)去年曾透露,該公司構建模型的成本約為1億至10億美元。

與其他一些頂尖大模型不同,DeepSeek-R1沒有使用傳統的監督微調(SFT)方法,而是專注於強化學習(RL),這意味著該模型跳過了使用人工標準數據訓練的「模仿」環節。

英偉達高級研究科學家范麟熙(Jim Fan)稱贊DeepSeek取得了突破,他在社交平台X上發文稱,DeepSeek-R1完全由強化學習驅動,「這讓人想起了AlphaZero,從零開始學習圍棋、將棋和國際象棋,而不是先模仿人類大師的動作。這是論文中最重要的收穫。」

DeepSeek-R1的表現引起美國科技行業的高度關注。

矽谷風險投資家馬克·安德森(Marc Andreessen)表示:「DeepSeek-R1是我見過的最令人驚嘆,最令人印象深刻的突破之一。」

舊金山AI硬件公司Positron的聯合創始人巴雷特·伍德塞德(Barrett Woodside)表示,最近他和同事一直在討論DeepSeek的開源模型,「這太酷了。」

一些美國企業也開始在工作中使用DeepSeek。

AP圖片

AP圖片

矽谷一家創業公司的聯合創始人安東尼·普奧(Anthony Poo)告訴《華爾街日報》,他們原先使用Claude模型預測財務回報,但現在已轉向DeepSeek,兩者性能相似,使用DeepSeek的成本僅為Claude的四分之一。

普奧說:「OpenAI的模型有著極佳的性能,但我們不想為我們不需要的能力付費。」

DeepSeek發佈後不久,Meta首席執行官朱克伯格就宣佈,Meta計劃在2025年投入超600億美元,加大對人工智能的投入。扎克伯格本人一直是開源模型的倡導者。

1月27日,據Information網站,臉書母公司Meta成立了四個專門研究小組來研究DeepSeek的工作原理,並基於此來改進旗下大模型Llama。

其中兩個小組正在試圖瞭解幻方量化如何降低訓練和運行DeepSeek的成本;第三個研究小組則正在研究幻方量化可能使用了哪些數據來訓練其模型;第四個小組正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。

OpenAI、Meta和其他頂級人工智能團隊的開發人員一直在仔細研究DeepSeek模型,並試圖搞清楚其為何能夠比一些美國製造的模型更便宜、更高效地運行。

OpenAI科學家Noam Brown上周在社交媒體上表示:「DeepSeek表明你可以用相對較少的計算獲得非常強大的AI模型。」

數日前,就有Meta的工程師們在匿名社交平台TeamBlind上吐露心聲,表示DeepSeek所研發的AI模型為其帶來了巨大壓力。

近年來,美國在芯片等領域對中國實施出口限制,試圖打壓中國在AI等領域的發展,但深度求索依然能構建出匹敵美國頂尖科技公司的AI模型。OpenAI前高管扎克·卡斯直言,美國的限制未能阻止DeepSeek的進步,「這凸顯了一個深刻的教訓:資源限制反而能激發創造力。」

AP圖片

AP圖片

數字新聞雜誌The Wire China發文稱,DeepSeek-R1的發佈將迫使懷疑論者重新評估中國的技術發展。深度求索對開源承諾的堅持也與OpenAI的專有策略形成鮮明對比,深度求索允許全球企業和開發者共同開發和改進技術,OpenAI則限制對其系統的訪問以維護競爭優勢。

該雜誌指出,美國決策者應該反思,通過設置障礙來確保領先地位的方法是否還行得通。美國的出口管制促使中國加速實現技術的自給自足,中美在芯片等領域的技術差距正逐漸縮小,美國的制裁雖然具有破壞性,卻可能反過來助推中國的創新能力。

文章寫道,美國的出口管制不僅削弱了美國科技公司的收入,也導致全球半導體供應鏈變得愈發「支離破碎」,「美國越是專注於遏制對手而不解決自身的缺陷,就越有可能加速其領先地位的喪失。」




深喉

** 博客文章文責自負,不代表本公司立場 **

美國總統特朗普第二任期快滿一周年之際,作為「白宮大管家」的白宮幕僚長懷爾斯(Susie Wiles)接受《名利場》雜誌(Vanity Fair)訪問,毫無保留大爆白宮內幕,不單形容特朗普是「酒鬼型人格」、副總統萬斯是「陰謀論者」、億萬富豪馬斯克是一個公開承認的「氯胺酮使用者」及「怪人」,還承認了特朗普政府的「清算」行為及內部重大經濟政策上的嚴重分歧。

綜合美媒報道,白宮幕僚長蘇西·懷爾斯(Susie Wiles)12月16日與《名利場》雜誌作家克里斯·惠普爾(Chris Whipple)進行第11次深度訪談,懷爾斯將不飲酒的特朗普形容為具有「酒鬼型人格」(alcoholic's personality),稱美國副總統萬斯是「一個十年的陰謀論者」(conspiracy theorist for a decade),又指億萬富豪馬斯克是「一個公開的氯胺酮使用者」(avowed ketamine user)及「古怪的人」(an odd, odd duck)。

白宮幕僚長蘇西·懷爾斯形容,特朗普具「酒鬼型人格」。AP資料圖片

白宮幕僚長蘇西·懷爾斯形容,特朗普具「酒鬼型人格」。AP資料圖片

作為特朗普復出的「頭號功臣」,懷爾斯說,其已故的父親是一名著名體育評論員帕特·薩默羅爾(Pat Summerall),也一名曾經的酗酒者,所以她很了解他們,當他們喝酒時,性格會被無限放大,特朗普雖然不喝酒,但他就像那些人一樣,持有一種「認為自己無所不能」、「什麽都行、零限制」的特質。

懷爾斯透露,她曾試圖在特朗普上任之初與他達成一項「鬆散的協議」,即在90天內結束所有的清算行為,但她承認,最終沒有發生,也不成功,雖然特朗普並非醒來就在想復仇,但「當機會來臨時,他就會去做。」

她以紐約州總檢察長詹樂霞(Letitia James)為例,後者曾因商業欺詐案對特朗普處以近5億美元罰款,懷爾斯坦言「那可能就是一次報復」,當被問及是否建議特朗普收手時,懷爾斯說:「對她不行。她拿了他五億美元。」

對副總統萬斯(JD Vance),懷爾斯毫不客氣直言,萬斯從激烈的「反特」批評者變為其忠實盟友,是一場赤裸裸的政治算計,「他的轉變發生在他競選參議員時,我認為這種轉變更多是——某種程度上的政治投機。」

懷爾斯形容,億萬富豪馬斯克是「一個公開的氯胺酮使用者」及「古怪的人」。AP圖片

懷爾斯形容,億萬富豪馬斯克是「一個公開的氯胺酮使用者」及「古怪的人」。AP圖片

至於馬斯克(Elon Musk),據懷爾斯形容,「應對馬斯克的挑戰在於你得跟上他的節奏」,她描述了一個令人匪夷所思的場景,「馬斯克白天甚至會睡在行政辦公樓的睡袋裡」,「他是一個非常、非常古怪的傢伙,我想天才都是這樣。但這(對白宮運作)真的沒什麽幫助。」 

最令懷爾斯感到「驚愕」(aghast)的是馬斯克對美國國際開發署(USAID)的「清洗」,馬斯克主導了大規模的裁員和機構癱瘓,甚至在社交平台轉發關於史太林和希特拉的驚人言論,對此懷爾斯直言:「我覺得那是他在『微量服用迷幻劑』(microdosing)的時候發的。」

儘管懷爾斯隨後在《紐約時報》訪問中試圖否認關於馬斯克涉毒的言論,稱其「荒謬」,但錄音卻證實她的驚人語錄。

懷爾斯指,萬斯從激烈的「反特」批評者變為其忠實盟友,是一場赤裸裸的政治算計。AP圖片

懷爾斯指,萬斯從激烈的「反特」批評者變為其忠實盟友,是一場赤裸裸的政治算計。AP圖片

另懷爾斯還揭露了特朗普核心團隊的緊張關係。特朗普曾公開表示,副總統萬斯極有可能成為其繼任人,而懷爾斯就評價了萬斯和國務卿魯比奧,當中有鮮明對比。她認為,魯比奧轉向支持特朗普是基於原則,「他不會違背自己的原則」,但萬斯的轉變則更多是「政治性」。

懷爾斯透露,白宮內部對特朗普關稅政策有有巨大分歧。AP資料圖片

懷爾斯透露,白宮內部對特朗普關稅政策有有巨大分歧。AP資料圖片

對於特朗普掀起的全球關稅戰,懷爾斯透露,其實白宮內部對此有有巨大分歧。她回憶指「我們曾告訴特朗普,今天先別談關稅,等到團隊完全達成一致再說,但特朗普無視,直接宣布了政策。」結果,正如懷爾斯所言「這比我預期的要痛苦得多。」

懷爾斯坦言,自己讀過「愛潑斯坦檔案」,特朗普的名字出現在其中。

懷爾斯坦言,自己讀過「愛潑斯坦檔案」,特朗普的名字出現在其中。

懷爾斯也提到另一個更敏感的議題「愛潑斯坦醜聞」。她坦言,自己讀過「愛潑斯坦檔案」,特朗普的名字出現在其中,「當時在(愛潑斯坦的)飛機上……他的名字出現在乘客名單上…他們當時都挺年輕,單身…我知道『單身』這詞有點過時了,但就是那種年輕、單身、花花公子聚在一起。」

但懷爾斯將矛頭直指司法部長邦迪(Pam Bondi),「我認為她完全搞砸了(completely whiffed)」,「她給了大家幾本毫無內容的空文件夾(binders full of nothingness),然後她說客戶名單就在她桌上,但根本沒有客戶名單。」

她還披露關於前美國總統克林頓的調查結果,儘管特朗普多年來一直聲稱克林頓曾去過愛潑斯坦的私人島嶼聖詹姆斯島,但懷爾斯澄清「沒有證據……總統在那一點上搞錯了」,特朗普曾毫無證據地聲稱「克林頓曾到訪愛潑斯坦私人島嶼據說有 28 次。」

另外,懷爾斯還透露,特朗普對委內瑞拉的戰略「他想一直炸毀船隻,直到馬杜羅(委內瑞拉總統)認輸為止,比我聰明得多的人都說他會這麼做。」

儘管種種辛辣的評價,懷爾斯對自己在白宮的角色定位卻異常清晰,就是她「不來踩剎車」的。萬斯曾在採訪中描述,「Susie的觀點完全相反,她認為自己是一個促進者。」懷爾斯自己也說「我不是一個縱容者,我也不是一個潑婦,我想時間會證明我是否有效。」但當要就具體決策進行博弈時,她承認「有幾次我被投票否決了。」 她更總結,「如果出現平局,那就是他(特朗普)贏。」

但特朗普事後接受《紐約郵報》專訪時為懷爾斯辯護,強調她表現出色,指《名利場》文章涉嫌誤導。

你 或 有 興 趣 的 文 章