1月27日,炒美股的投資者遇上一隻黑天鵝。美股「七巨頭」王中之王的AI芯片公司英偉達,單日暴跌17%,令這隻本來市值3.5萬億美元的巨股,單日蒸發了5580億美元(4.3萬億港元)的市值,而觸發這場風暴的,是一間中國初創公司的Deep Seek(深度求索)人工智能大模型。
深度求索可以投下這一枚重磅炸彈,是因為它顛覆了世人對AI發展的想像。自從美國的ChatGPT人工智能大模型推出之後,美國穩站AI的領導地位,不止是擁有最先進的人工智能大模型,拜登政府還透過限制向中國出口高端的人工智能芯片,打茅波卡壓中國的AI發展。
人工智能芯片巨頭英偉達的A100和H100芯片,先在2022年9月被禁止出口至中國,後來英偉達特別為中國客戶推出閹割版的A800和H800芯片,算力大幅下壓,以符合美國限制出口中國的算力要求,但拜登政府意猶未盡,在2023年10月再推出新禁令,連A800和H800都不能出口至中國。在禁令實施之前,英偉達在中國的人工智能芯片市場市佔率高達90%,換言之,美國就是要全面扼殺中國的人工智能發展。
不過,深度求索大模型推出之後,完全顛覆了美國的想像。這個大模型在多項測試方面都追上甚至超越ChatGPT等美國大模型的最新版本,但更令人震驚的是,它只是用了560萬美元,訓練模型的時候只是用了2048張之前買下來的H800芯片,這個價錢是美國訓練大模型零頭的零頭,美國人想像不到,竟然可以用那麼少的錢,做出超越美國的AI大模型。
深度求索大模型之所以能做到如此高效,當中有幾個特點,內地自媒體茶狐看世界做了很好的總結:
首先,Deep Seek(深度求索)重新思發展AI的方式,傳統AI就好像將每個數字都寫到有32個位的小數,但深度求索就想,如果只是寫到8個位小數會如何呢?結果發現這樣仍然足夠準確,但是就節省了75%的內存。
第二,它用一個多標記的系統。傳統人工智能的閱讀方式,就好像小學生一樣逐字去閱讀,但深度求索就是一次過讀完整段說話,速度快兩倍、準確度高90%。大家可以想像同時要處理數十億個單詞的時候,這種速度是快了多少。
第三,它有一個專家系統。傳統人工智能大模型是一個同時運作起來包括醫生、律師、工程師等等的專家系統,但是深度求索平時只是用一般智能處理,有需要的時候才激活專家。
第四,減少激活參數。傳統的人工智能模型有1.8萬億的參數同時處於活躍狀態,深度求索總共亦只有6710億個參數,但每次只需激活370億個參數。這亦都等於是,它有一個類近的龐大隊伍,但每次只需激活少量相關任務的專家。
第五,完全免費。深度求索最恐怖的地方是它是開源的,是完全免費的。現在網上有一個笑話,指OpenAI其實是ClosedAI(閉源AI),因為它的收費是相當貴,只有深度求索才是OpenAI(開源AI)。
深度求索大模型用如此高效的運作,完全顛覆整個AI行業的想像,科技巨頭開始探索使用深度求索同樣的方式,這就不用大量採購英偉達的芯片,而數據中心的業務也會受挫,因為AI開發者不需要租用他們那麼多的英偉達芯片,這固然最後的衝擊都會完全落在英偉達身上。當大家突然發覺原來皇帝是沒有穿新衣的時候,就會一哄而散。
英偉達即使股價下跌了,市盈率仍高達接近47倍, 如果他的盈利沒有增長,甚至下跌,又怎樣值47倍的市盈率呢?
深度求索大模型成為一隻美國AI甚至是美國股市的黑天鵝,主要有三個啟示。
第一,美國財太大、氣太粗。美國科技公司和基金界由於太有錢,發展AI的時候亦是用一個放量採購芯片的豪華方式研發,從無想過用高效的方式,這個就是有錢的毛病,錢太多,就沒有窮人的想像力。
第二,極限制裁搞不死中國。美國自2018年之後,要扼殺中國的科技發展,對中國展開一輪又一輪的制裁,但是事實已經證明,制裁打不死中國的科技公司,美國當日制裁華為,但華為就發展了自己的芯片,在2023年9月就重新推出自己的手機,去年第四季在國內的手機市場重回第一。
今次深度求索展現了另一個神話,美國卡壓人工智能芯片輸往中國,打不死中國的AI公司,反而益了華為開發的AI芯片。
第三,刺穿了美國的科技泡沫。現在美國華爾街真正擔心的是,他們7隻市值最大的科技公司,帶動整個美股近年狂升不已,恐怕這只是一個泡沫,他們只希望這次深度求索並未擊倒英偉達,否則這只是泡沫爆破的開始。
盧永雄