Skip to Content Facebook Feature Image

全球6大頂尖AI實盤投資大賽 中國包攬冠亞 美國4大模型虧損墊底

博客文章

全球6大頂尖AI實盤投資大賽 中國包攬冠亞 美國4大模型虧損墊底
博客文章

博客文章

全球6大頂尖AI實盤投資大賽 中國包攬冠亞 美國4大模型虧損墊底

2025年11月05日 11:11 最後更新:11:30

由第三方機構、美國人工智能研究實驗室Nof1於10月18日發起的AI大模型實盤交易投資比賽「Alpha Arena」(阿爾法競技場),讓全球6大頂尖AI模型在加密貨幣市場展開對決,歷時17天,終在11月4日圓滿落幕。結果,2款中國模型包攬冠亞軍,阿里千問Qwen以一波精準操盤,以超20%的殖利率奪冠;DeepSeek則排名第二,成為全場「唯二」獲利的大模型;美國4大頂尖模型則全部虧損,GPT-5虧損超過60%「墊底」。

阿里千問Qwen以超20%的殖利率奪冠。

阿里千問Qwen以超20%的殖利率奪冠。

今次比賽集合了全球6大頂尖模型,包括Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4,是第一個人工智能投資能力的基準測試平台。每個模型獲提供1萬美元真金白銀及金融市場的即時價格及各類指標數據,於Hyperliquid交易所進行加密貨幣永續合約交易,全程沒有人工干預,模型進行自主決策和交易,以測試AI在實時、變動、競爭激烈的環境中的決策水平,是現實世界任務的真實評測,成為近期最火熱的AI大賽。

DeepSeek v3.1一直處於領先位置,但最後輸給阿里Owen。

DeepSeek v3.1一直處於領先位置,但最後輸給阿里Owen。

競賽採用統一輸入方式,所有模型接收相同的市場數據和提示詞、交易記錄、持倉和帳戶價值實時公開,以確保比賽的公平性和透明度。

此外,Nof1還允許AI模型「聊天互動」,讓它們在模擬對話中辯論市場走勢,展示決策邏輯,最終根據盈虧情況選出冠軍。

比賽甫開始,6大模型都表現得挺克制,互相觀望、謹慎試水。之後的初期階段,DeepSeek v3.1一直處於領先位置,也讓這場比賽廣受國際關注。馬斯克旗下的Grok 4透過激進的投資策略,一度把與DeepSeek v3.1的差距縮短到1美元的位置,似乎有力問鼎。

不過,10月21日至22日的賽程成為了「轉折點」,這2日裡,Grok 4和Claude Sonnet 4.5的收益大幅下滑,由盈轉虧;到10月22日當日,6大模型的收益率更是一度全部告負。

但在此時,DeepSeek v3.1和Qwen3-Max自動改寫了投資策略,在其他4個大模型持續虧損的情況下脫穎而出,淨值曲線波動上漲,Qwen3-Max更趁機一度超過DeepSeek v3.1。

DeepSeek v3.1和Qwen3-Max在最後自動改寫了投資策略,也改寫了比賽結果,美國4大模型則持續虧損。

DeepSeek v3.1和Qwen3-Max在最後自動改寫了投資策略,也改寫了比賽結果,美國4大模型則持續虧損。

截至11月4日早上比賽結束,阿里千問最後超越DeepSeek,Qwen3-Max以超20%的收益率獲勝;DeepSeek亦實現盈利,位居第二。

惟美國的Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大模型均虧損,Gemini 2.5 Pro和GPT-5虧損尤見明顯,截至最終持倉總市值僅為初始資金的3、4成,GPT-5虧損更超62%包尾。

賽後,主辦單位Alpha Arena的創辦人Jay Azhang也為阿里千問Qwen模型的策略及表現點讚,並祝賀阿里千問最終贏得冠軍。

業界人士認為,阿里千問和DeepSeek在實戰中有優秀表現,證明中國AI模型在解決實際問題的強大潛力,AI對場景的深刻理解,將成為大模型「落地」和未來全球AI競賽的關鍵。

據全球知名的大模型API三方聚合平台OpenRouter在7月公佈的榜單,中國的DeepSeek和阿里通義千問躋身全球前5名。其中,通義千問以10.4%的市場份額,超越OpenAI的4.7%,排名第4。

OpenRouter的推文顯示,當下全球成長最快的前10大模型中,有9個是開源。其中,Qwen3-Coder調用量以近500億Tokens高居第一,通義千問包攬前3,並在前10中佔據5席。

今年9月,由創新工場董事長兼CEO 李開復創辦的AI 2.0「零一萬物」曾公開表示,DeepSeek對中國AI發展的核心貢獻在於推動了開源生態的形成,他說:「如果10年後,我們回顧DeepSeek怎讓中國沒有落後於美國,答案並非其技術能力本身,而是它帶來了中國(大模型)開源時代。」

李開復指,自DeepSeek開源以來,國內多家企業相繼開源大模型,形成了「既開源、又比拼速度」的良性競爭局面,開源模式高度契合中國企業的學習特性,協助中國在AI領域縮小與美國的差距。




毛拍手

** 博客文章文責自負,不代表本公司立場 **

日本首相高市早苗的「台灣有事」論,重創日本旅遊業,據日媒周三(12月3日)最新報導,中國赴日酒店預訂量暴跌逾50%。有日本酒店業界指,以往12月節日假期的房價相對較調,但現多數酒店在定價時都持觀望態度,更擔心中日關係惡化將持續。

據《日經亞洲》指,中日關系惡化對日本旅遊業造成衝擊,近來中國遊客赴日酒店預訂量暴跌逾5成。酒店預訂平台Tripla的數據顯示,11月21日至27日,中國遊客的酒店預訂量較11月6日至12日驟降57%。

《日經亞洲》指,中日關系惡化對日本旅遊業造成衝擊,近來中國遊客赴日酒店預訂量暴跌逾5成。

《日經亞洲》指,中日關系惡化對日本旅遊業造成衝擊,近來中國遊客赴日酒店預訂量暴跌逾5成。

報導稱,中國遊客對日本旅遊業至關重要。今年1至10月,來自中國內地和香港地區的遊客達1022萬人次,遠超韓國的766萬人次,過去深受中國遊客喜愛的關西地區也因遊客驟減而備受打擊。

大阪酒店訂單取消數量最嚴重。大阪觀光局局長溝畑宏上周四(11月27日)表示,大阪20家酒店表示,截至12月31日中國客的預訂,有50%至70%被取消,「有些酒店幾乎空了,不能掉以輕心」。而中國遊客10月佔大阪外國遊客的24%。

據報道指,關西的內地遊客大減。

據報道指,關西的內地遊客大減。

但目前酒店價格未明顯下跌。大阪帝國酒店相關人士表示,年底都是節日假期,12月房價仍將相對較高,但現時多數酒店對定價都持觀望態度,擔心中日外交爭端長期化。

在京都,一名魚販表示,中國遊客少了20%至30%,肯定影響店鋪的銷售額。據京都市觀光協會上周五(11月28日)的報告顯示,京都部分旅館已出現中國遊客取消訂單的情況。

該報告指,若中國遊客住宿量像過去韓日外交爭端時那樣減半,11月整體入住率預計將下降4.7個百分點,較去年同期跌3個百分點至84.4%。

目前,北海道旅遊受到的衝擊相對較少。惟《日經亞洲》指,由於中國遊客偏愛在冬季前往北海道,明年2月中國春節假期尚未來臨,潛在影響或擴大。

關西國際機場12月第二個星期,往來中日的冬季航班僅剩348班,較原計劃的525班大幅減少。

關西國際機場12月第二個星期,往來中日的冬季航班僅剩348班,較原計劃的525班大幅減少。

但隨著中日關係惡化升級,日本國際機場和郵輪業也遭受重創。據關西國際機場運營商「關西機場株式會社」的數據顯示,12月第二個星期,往來中日的冬季航班僅剩348班,較原計劃的525班大幅減少;而明年1月起,中日之間的航班預計平均減少28%。

此前,航空數據公司Cirium數據顯示,中日之間共有176條定期航線,連接日本20個機場和中國內地36個機場(不包括港澳台地區)。截至11月27日上午,中國航空公司已取消72條航線上的904架次航班,佔原計劃5548班的16%,相當於約15.6萬個座位,較25日取消的268架次大幅增加。另多艘來自中國的郵輪已取消停靠日本港口的計劃。

高市早苗「台灣有事」言論後,引發多方強烈批評。

高市早苗「台灣有事」言論後,引發多方強烈批評。

自11月7日高市早苗在日本國會答辯時發出「台灣有事」或構成日本可行使集體自衛權的「存亡危機事態」言論後,引發多方強烈批評。外交部近期多次表示,日方應當認真對待中方的嚴肅要求,收回錯誤言論,切實把對華承諾體現在實際行動上。11月14日,外交部提醒中國公民近期避免前往日本。

而多個中日交流項目亦已取消;另爵士樂手鈴木良雄、歌手吉田亞紀子、濱崎步等多名日本藝人在華的演出均被取消。

據日本共同社報道,12月1日,日本自民黨前選舉對策委員長、「日中友好議員聯盟」事務局長小淵優子稱,希望年內派代表團訪華。早前,日本經濟團體聯合會會長筒井義信也向中方傳達了希望派團訪問中國的請求。 

12月2日,外交部發言人林劍回應表示,注意到日本國內有很多有識之士對高市的錯誤涉台言論引發的惡劣影響和嚴重後果深感憂慮。中方敦促日方反思糾錯,撤回高市首相的錯誤言論,停止傷害兩國的國民感情,以實際行動體現對華的政治承諾,為中日的正常交流創造必要條件,希望日本的相關團體在日本國內多發揮積極作用。

你 或 有 興 趣 的 文 章