網傳史丹佛大學AI團隊抄襲、「套殼」中國國産大模型成果,引起業界高度關注和熱議。目前,涉事的史丹佛學生已公開正式道歉。
史丹福大學的一個研究團隊在5月29日發布Llama3-V項目,宣稱僅需500美元就能訓練出一個SOTA(State of the Art,即最先進的)多模態大模型,效果比肩GPT-4V、Gemini Ultra、Claude Opus等,但模型小100倍。
公開信息顯示,Llama3-V團隊的其中兩位作者 Siddharth Sharma 與 Aksh Garg 是史丹福大學計算機系的本科生,曾發表過數篇機器學習相關的論文。
名校背景,特斯拉、SpaceX等大廠經歷的成員,再加上號稱足以「改變現狀」的研究成果,Llama3-V受到了相當程度的關注。Llama3-V不僅在社交媒體上迅速躥紅,還一度沖上了HuggingFace趨勢榜(機器學習領域中較有影響力的平台,其趨勢榜一定程度反映出模型的流行度)的首頁。
然而,沒過幾天,一位網民發現,Llama3-V的模型結構和代碼與出自清華系明星創業公司面壁智能的MiniCPM-Llama3-V 2.5幾乎一模一樣,只是變量名有所變化。
網民在面壁智能GitHub的項目下放出了證據。這些證據包括:Llama3-V的模型架構和代碼與MiniCPM-Llama3-V 2.5幾乎完全相同,僅有一些變量名和格式化的差异;Llama3-V使用了MiniCPM-Llama3-V 2.5的分詞器(tokenizer),並且連同MiniCPM-Llama3-V 2.5定義的特殊符號也出現在了Llama3-V中;將從HuggingFace下載的Llama3-V模型權重中的變量名改成MiniCPM-Llama3-V 2.5的,模型可以用MiniCPM-V代碼成功運行。
兩個模型的代碼對比
網民為什麽不直接質疑Llama3-V,而是在面壁智能GitHub的項目下進行爆料?事實上,網民此前於6月2日在Llama3-V頁面上提出的質疑,不過很快便被Llama3-V的作者已經删除了。
為此,提出質疑的網民被激怒暴走,跑到了 MiniCPM-V 的 Github 頁面進行事件還原,提醒面壁智能團隊關注此事。
在MiniCPM-Llama3-V 2.5團隊收到提醒後也迅速作出反應,於是一個新的證據出現。
面壁智能的MiniCPM-Llama3-V 2.5項目具有獨特的功能,如識別清華簡——一種罕見的中國古代文字。
公開資料顯示,清華簡是清華大學於2008年7月收藏的一批戰國竹簡,為戰國中晚期文物。MiniCPM-Llama3-V 2.5團隊透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓練圖像是最近從出土文物中掃描並由MiniCPM-Llama3-V 2.5團隊標注,且尚未公開發布。
識別結果對比
Llama3-V模型居然也可以識別「清華簡」。兩個模型在識別的表現上,正確的結果上基本一致,錯誤的情况也頗為相似。
鑒於這些結果,MiniCPM-Llama3-V 2.5團隊表示,很難用巧合來解釋這種不尋常的相似性,希望Llama3-V的作者能够對這個問題給出官方解釋。相信這對開源社區的共同利益很重要。
當網民拋出三大事實質疑後,Llama3-V的做法是——不回應直接删除網民評論。
目前,Llama3-V 的 GitHub 項目主頁已顯示為「404」,HuggingFace上Llama3-V項目也已經不可見,在作者社交媒體賬號上也找不到此前宣傳 Llama3-V 的內容。
目前Llama3-V項目已經從開源網站中下架删除。
6月3日,Llama3-V團隊成員Aksh Garg在社交媒體上發文回應了質疑。但隨後不久這條回應便被删除。
Llama3-V在未公開的實驗性特徵上與MiniCPM-Llama3-V 2.5表現出高度相似的行為,這些特徵是根據MiniCPM-Llama3-V 2.5團隊內部數據訓練的。
面對抄襲的質疑,史丹福團隊最初辯稱,他們的工作早於面壁智能的MiniCPM,只是使用了他們的tokenizer。
另據媒體消息,面壁智能聯合創始人兼CEO李大海在朋友圈回應說「深表遺憾」,這也是一種「受到國際團隊認可的方式」,並呼籲大家共建開放、合作、有信任的社區環境。
面壁智能聯合創始人兼CEO李大海在朋友圈的回應。
面壁智能首席科學家、清華大學長聘副教授劉知遠表示,人工智能的飛速發展離不開全球算法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCPM-Llama3-V 2.5 就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞了這一點。他們在受到質疑後已在Huggingface删庫,該團隊三人中的兩位也只是史丹福大學本科生,未來還有很長的路,如果知錯能改,善莫大焉。
北京面壁智能科技有限責任公司成立於2022年8月,今年4月,面壁智能完成新一輪數億元融資,由華為哈勃領投,春華創投、北京市人工智能産業投資基金等跟投,知乎作為戰略股東持續跟投支持。今年2月,面壁智能發布開源模型MiniCPM後,又推出MiniCPM 2系列端側模型。李大海表示,推動大模型在端側的落地是面壁目前的重點工作之一。
據第一財經報道,在最新的進展中,史丹福Llama3-V團隊的兩位作者Siddharth Sharma和 Aksh Garg在社交平台上就這一學術不端行為向面壁MiniCPM團隊正式道歉,並表示會將Llama3-V模型悉數撤下。
Christopher David Manning發文譴責。
另外,史丹福人工智能實驗室主任Christopher David Manning也發文譴責這一抄襲行為,並對MiniCPM這一中國開源模型表示贊揚。
Manning寫道,「怎能不為自己的錯誤買單!清華大學自然語言處理實驗室做出了很棒的開源工作,有力推動科學發展。」
Manning還痛斥道:「所謂『真正做到之前,假裝你做到了』是矽谷的無耻産物。」Manning引用的這句流行語「Fake it before you make it」,一度盛行於矽谷的初創圈和科技公司,被不少創業者奉為圭臬。
毛拍手
** 博客文章文責自負,不代表本公司立場 **
台灣可徵兵員首次跌破十萬,年底或還將爆發飛行員離職潮,島內媒體憂慮作戰部隊戰力不足,可能「無人可用」。
據《環球時報》引述台灣「中央社」5月26日報道,台灣「國防部」表示,受少子化影響,台「內政部」列管可徵役齡男子(簡稱「役男」)預判,今年尚有9.8萬人、首度跌破10萬人,2031年將僅剩下7.4萬人。台媒對此哀嘆「年年下滑」。台軍志願役部隊因為少子化、疫情、就業市場競爭以及福利待遇等問題,「編現比」(實際人數與額定人數之比)也呈現逐年下滑趨勢。
蔡英文上台以後,台軍體能測試標準大幅下降。有部分台軍士兵被叫作「草莓兵」,意指這些士兵體能差、抗壓性不足。資料圖片
據台灣《聯合報》介紹,目前台灣兵役制度實行征(義務役)、募(志願役)並行,符合條件的役齡(18-36歲)男子都需要服兵役。其中備受爭議的是義務兵役制度。上世紀90年代,台軍各軍種的義務兵役時限統一為兩年。但由於社會各界的持續抵觸,台灣當局於2008年與2018年兩次縮短服役期限後,台軍義務役男僅需要服役4個月。然而此舉也遭到台軍內部的强烈反對,認為在如此短暫的服役時間裏,台軍士兵能熟悉隊列和簡單的槍械操作就不錯了,根本來不及掌握現代高科技武器的使用。多家美國智庫也根據俄烏衝突中烏克蘭方面的動員經驗向台灣當局建議,需要保持數量龐大且經過充分訓練的後備兵源「才能應對未來的台海衝突」。受此影響,台灣當局又宣布從2024年1月1日開始,義務役男恢復一年役期。
台軍義務兵役制度的反復,折射出台軍始終擺脫不了兵源不足的困境。其中少子化是首要因素。今年2月,全台共出生9663人、死亡17462人。自2021年1月以來,台灣社會已經連續38個月「生不如死」。為解决少子化給台軍帶來的一系列問題,馬英九當局嘗試推行「全募兵」制,建立「小而精,小而强」的現代化軍隊。但在實際操作中台軍發現,台灣青年普遍不願意到兵營「受罪」。根據台「國防部」統計,2013年1月到12月,台軍招募的士兵只達到目標的三成左右。在步兵和裝甲部隊,招募到的士兵比例甚至更低,分別為目標的4%和16%。正是因為「全募兵」制的嘗試遇挫,如今民進黨當局才試圖通過恢復一年役期的義務兵役制度,至少保持台軍的規模不要出現嚴重下滑。
近年來台灣青年的身體素質也在持續下降。2022年台灣「立委」莊瑞雄透露,當時已經體檢的7.595萬役男中,1.7844萬人因為身體等原因「免役」,「等同4名年輕人中就有一人不用當兵」。為了完成徵兵指標,台軍近年來持續下調相關標準。2022年台軍宣布提高「免役」標準,身高低於155厘米,BMI值(體重(公斤)除以身高(米)的平方)超過35或低於15才能免除兵役。以身高170厘米的男子為例,想要「免役」的話,體重需要超過101.2公斤。這意味著「如果不是極胖,一般的胖子都得服兵役」。2023年,台軍又宣布志願役士兵的男性身高下限由158厘米放寬為152厘米,女性由155厘米放寬為150厘米。這也被島內民眾嘲諷為「抓完胖子抓矮子」。
同時,台灣當局近年堅持頑固的「台獨」道路,導致台海局勢持續緊張,也大幅增加了台灣青年服兵役的抵觸情緒,視服役為畏途,拒當「炮灰」。
華爾街日報2021年一篇題為《台灣軍隊有機會對抗中國嗎?很少有人這麽認為》的報道稱,準備不足、士氣低落是台軍亟待解决的問題;士兵們在基礎訓練中掃落葉、拔雜草。報道截圖
兵員不足給台軍帶來一系列無解的難題。為了緩和島內青年對當兵的抵觸情緒,台軍訓練標準一松再松。台灣「風傳媒」網站披露,自從蔡英文當局上台以來,台軍的體測標準大幅下降,跑步合格時間普遍放寬1分到1分半左右,仰臥起坐合格標準也降低了1/3。至於台軍日常訓練中的「草莓兵」更為突出。就連美國《華爾街日報》採訪時也對台軍義務役的訓練和準備程度感到「擔憂」。這些台軍士兵直言在訓練時因為已經沒有其他有用的事可以做,就看美軍電影;還有士兵說自己花很多時間看書和畫畫。來自台中的一名26歲青年說,自己在4個月兵役期的基礎訓練,主要內容是掃樹葉、移動備用輪胎和除草,除了射擊培訓,其他課程毫無意義。
除了訓練標準的持續降低,台軍內部更擔憂的是作戰部隊「無人可用」。依台灣「國防部」的規劃,主戰部隊以志願役為主,守備部隊以義務役為主,主要派駐台灣本島、外島以及灘岸與重要基礎設施的防護等。然而根據台軍相關報告,陸軍步兵、炮兵、裝甲部隊,海軍艦隊、「海鋒」大隊、海軍陸戰隊,空軍導彈部隊等第一綫戰鬥部隊的實際兵力均不及編制人數的8成。2024年度台防務預算書顯示,台軍士官長、士官、士兵人數將合計减少5142人,這些主戰部隊的可用人力明顯下滑。而台軍近年大量採購新型裝備,則需要增加配套的人員編制,更加大了主戰部隊兵力不足的問題。例如台灣海軍因為從美國採購100套「魚叉」反艦導彈,「海鋒大隊」擴編為「海軍制海導彈指揮部」,都已向台「國防部」提出增加人手的要求。
台當局原本希望新招的一年期義務役部隊加入後可以補充作戰部隊的兵力。蔡英文宣稱「當兵絕對不會浪費時間」,並舉例稱,台軍已經將傳統的刺槍術訓練調整為近戰格鬥訓練,並要增加「毒刺」防空導彈、「標槍」反坦克導彈、「紅隼」火箭彈以及無人機等新式武器的訓練,以符合現代作戰的需求。但台軍方人士坦言,「毒刺」導彈的單價超過2400萬元新台幣,「怎麽可能讓義務役士兵人人練習?」何况美國已經屢次推遲交付「毒刺」「標槍」等單兵導彈,即便交貨成軍,也必然會優先部署於台軍主戰部隊,這些義務役士兵很難有機會接觸「毒刺」導彈。
島內學者揭仲也認為,台軍志願役部隊主要負責作戰任務,其人員短少對台軍戰力造成的損害,無論是武器使用還是作戰經驗,都遠不是這些一年期義務役士兵可以彌補的。此外,台灣本島可供地面部隊進行基地訓練的場地有限,連台軍主戰部隊的聯兵營都無法每年實施基地訓練,由義務役組成的守備旅步兵營不太可能有機會在訓練基地接受完整的戰鬥教練。
近日島內網絡論壇上出現一篇自稱台空軍現役飛行員發布的帖子,表示「基層壓力已到臨界點,接下來空軍遲早會垮,自己寧願賠錢走人」。儘管台軍宣稱「網絡說法並非事實,民眾要提防有心人士散播假訊息」,但島內媒體接連爆料稱,台空軍飛行員短缺問題由來已久,今年年底還可能出現離職潮。
島內媒體透露,台灣空軍飛行員不足已經是老問題了。台灣地區立法機構的數據顯示,台灣空軍2011至2019年共僅新增21名飛行員。台灣中時新聞網稱,願意參加台空軍的人本來就少,導致「台空軍院校的錄取分數最低」,在接受基本飛行課程後,還會淘汰其中很大部分。例如某一批次的受訓學員在基本訓練課程開始時有45人,結束時僅剩21人。台灣空軍退役少將栗正傑稱,按照現行的培訓體制,台灣空軍飛行員成為能駕駛F-16V、「幻影2000」戰鬥機的骨幹時大概已經30歲,等到40歲就基本不再承擔一綫任務,因此「台空軍戰鬥機飛行員一綫作戰也就六七年」。
台軍退役少將稱,台灣從美國採購的F16V戰鬥機將交付,但「人從哪裡來?」。中時新聞網資料圖片
為了改變台空軍飛行員不足的問題。蔡英文宣布從2020年開始大幅提高「續服獎助金」,發放對象是服役超過14年、已可選擇退伍的飛行員。這些獎助金一簽5年,如果中途反悔退伍,必須退還已領款項。台媒透露,加上這些補助後,台軍骨幹飛行員的總收入已超過了台灣民航公司的副機長,因此過去4年台軍飛行員的退伍比例相對穩定。但今年年底「續服獎助金」的5年協議到期,大批飛行員面臨是否續簽的選擇。有台軍官員透露,如今各大航空公司正積極招募飛行員,而解放軍軍機頻頻繞台,「台軍一綫飛行員非常辛苦,目前已有選擇提前賠錢退伍的例子」。他表示,今年底台空軍飛行員退伍的狀况「不容樂觀」。
栗正傑還提到,台灣從美國採購的全新66架F-16V戰鬥機即將陸續交付,這意味著額外需要補充超過100名飛行員,「人從哪裏來?」台灣空軍前副司令張延廷也表示,在兩岸情勢緊張之下,台空軍資深飛行員頻繁執行警戒或攔截任務,不但「生理心理上的壓力很重」,而且還影響了新飛行員的培訓。因為新飛行員需要資深飛行員帶飛,而後者以作戰優先,因此相關訓練就只能往後延,這反過來又加劇了台空軍飛行員短缺的問題。