Skip to Content Facebook Feature Image

對話研發團隊,為何讓人工智慧玩《王者榮耀》

博客文章

對話研發團隊,為何讓人工智慧玩《王者榮耀》
博客文章

博客文章

對話研發團隊,為何讓人工智慧玩《王者榮耀》

2021年07月16日 17:32

(記者 宋宇晟)「整體的感覺就是AI太猛了,它們總是能做出異於常人的反應……」

在1:3輸給人工智慧後,有王者榮耀電競職業選手這樣說到自己對戰時的感受。

更多相片
比賽現場。受訪者供圖

比賽現場。受訪者供圖

此後更有網友在社交媒體直言,「人類連玩遊戲也打不過AI了」“人類再次一敗塗地”……

那麼,讓人工智慧去玩《王者榮耀》就是為了「虐菜」嗎?中新網記者最近和該AI模型負責人聊了聊。

比賽現場。受訪者供圖

比賽現場。受訪者供圖

3:1 「屬於正常發揮」

幾天前,在世界人工智慧大會現場,一款名為「絕悟」的遊戲AI與五位來自王者榮耀職業聯賽的選手現場進行了一場表演賽。

指出,人工智慧在比賽中相繼打出了「蹲草」“前後拉扯輸出”“輔助開團”等操作,並在團隊合作上頗具專業意識。

在這場五局三勝的賽事中,人工智慧以3:1的比分戰勝了五位職業選手。

儘管勝負成績成了關注這場比賽的網友討論的熱點話題,但王者絕悟AI模型負責人邱福浩卻告訴記者,團隊對比賽的勝負沒有預期。

作為研發人員,他們更希望人工智慧可以把握與高水平玩家切磋的機會,驗證能力並不斷成長,雖然這樣的成績「屬於正常發揮」。

對話研發團隊,為何讓人工智慧玩《王者榮耀》
比賽現場。受訪者供圖

此外,很多網友猜測,相較於人類職業選手的反應速度,人工智慧或許在操作方面有著「絕對優勢」。

然而,邱福浩卻向記者明確表示,在數值和操作上,王者絕悟AI並沒有獨特的優勢,在遊戲中的客觀條件限制是一致的。

「在英雄的自身狀態參數上,AI並沒有額外的加成,與人類玩家相同;AI在視野觀測上與人類玩家保持一致,對於戰爭迷霧中的不可見單位,AI同樣也看不到;AI的操作反應也做了客觀限制,其反應分佈和均值與KPL職業選手是相接近的。根據實際觀察,人類玩露娜等英雄會比AI更秀。」

AI一天對局數≈人類440年

既然客觀條件沒有什麼不同,人工智慧為何能戰勝人類職業選手?

邱福浩給出的答案是訓練量。「AI的優勢在於其龐大的訓練量,一天對局數約等於人類440年。」

用研發團隊的話說,自2017年啟動項目,王者絕悟AI從模仿人類的監督學習,到自我博弈的強化學習,經過了多次疊代,攻克了多個難題,才逐步進化成了全英雄職業電競水平的「完全體」。

邱福浩介紹,2018年,王者絕悟AI還只是頂尖業餘玩家的水平;到了2019年,王者絕悟AI不再需要模仿人類數據,而是通過自己和自己對戰,進一步提升微操水平和大局觀,已達到了王者榮耀職業電競水平;去年,它學會了更多英雄玩法,並用40個英雄首次接受玩家們的挑戰;最新版本中,團隊又在競技比賽的局前和局內階段,進行了針對性優化。

對話研發團隊,為何讓人工智慧玩《王者榮耀》
資料圖:2016年的圍棋人機大戰。

幾年前,AlphaGO擊敗人類職業圍棋選手時,一度震驚世界。

與圍棋相比,《王者榮耀》是一個不完全信息博弈場景,需要多個AI協作完成任務,且需在複雜連續的決策空間下進行長期決策。

換句話說,教會人工智慧玩《王者榮耀》,比讓人工智慧下圍棋更難。

邱福浩說,圍棋的動作空間多達10的172次方,而AI在王者榮耀一局遊戲中的操作可能性則多達10的20000次方。

對話研發團隊,為何讓人工智慧玩《王者榮耀》
比賽現場。受訪者供圖

讓AI打遊戲不是終點

但,進行如此複雜的研發、訓練,就只是為了讓人工智慧在遊戲中打敗人類嗎?

邱福浩並不這麼看。因為人工智慧最終是要服務於人類的。

他告訴記者,團隊之所以就此進行研發,首先是因為「這是一個多人協作的遊戲場景,它在設計上的高複雜度、高挑戰性,滿足了對高水平AI+遊戲的研究需要」。

「從近年AI發展的關鍵事件可以看到,AI的下一個里程碑很有可能就是在複雜策略遊戲中誕生。」

而人工智慧進行複雜遊戲訓練的,是為了幫助人類解決現實生活中的問題。

邱福浩說,AI在虛擬環境學習通用的感知、決策能力,未來可能在現實世界中發揮更大作用。以無人車研究為例,AI學習外界環境,感知道路環境信息並加以表達,進而作出駕駛決策;再如機械人在虛擬世界模擬學習,再在現實世界對環境的未知變化做出反應。

他認為,未來,AI研究還將覆蓋到更多場景。對於不少研究人員和開發者來說,多智能體技術研究依然存在顯著的現實困難,包括環境的不確定性、信息獲取的局限性、個體目標與全局目標的一致性,以及對高算力的要求。

在邱福浩看來,「AI+遊戲」研究將是團隊攻克AI終極研究難題——通用人工智慧(AGI)的關鍵一步。AGI代表研發能在通用系統中執行多種複雜命令,達到或超越人類水平的AI。

「這中間的經驗、方法與結論,長期來看,有望在大範圍內,如醫療、製造、無人駕駛、農業到智慧城市管理等領域帶來更深遠影響。」




神州快訊

** 博客文章文責自負,不代表本公司立場 **

圖:@瀋陽市公安局 微博截圖

2021年7月14日9時50分,瀋陽市大東區某生鮮超市發生一起刑事案件,犯罪嫌疑人田某某持刀將吳某某砍傷(經搶救無效死亡),並在逃跑過程中先後將8名群眾扎傷(其中1人經搶救無效死亡)。

7月14日13時20分,警方在渾南區白塔鎮大羊安村附近鎖定犯罪嫌疑人田某某活動區域後,立即調集警力對該區域進行封控,連夜開展地毯式搜查。7月15日18時4分,警方在該區域一污水井內發現犯罪嫌疑人田某某屍體。

目前,該案件共造成2人死亡、7人受傷(均無生命危險)。案件正在進一步工作中。