谷歌《星際爭霸2》新 AI 以 10:1 大敗人類職業選手
此前谷歌旗下的科技公司 DeepMind 宣布將在北京時間 1 月 25 日凌晨 2 點直播公司最新研制的 AI 和《星際爭霸2》職業選手之間的比賽,現在這個比賽已經完成,結果也頗讓人吃驚:谷歌 AI 以 10:1 的成績大勝兩位人類職業選手。
本次參賽的雙方分別是 DeepMind 專為《星際爭霸2》設計的 AI,其名為「AlphaStar」,人類職業選手則來自Liquid 戰隊的 TLO(蟲族選手)和 MaNa(神族選手)。需要說明的是,直播中公布的前 10 場比賽陸續是之前已經錄制好的,今天的直播只是現場解說和分析。只有最后一場比賽是今天凌晨現場對戰的。
據介紹,在 2018 年 12 月 10 日的對戰中,AlphaStar 以 5:0 戰績打敗了 TLO。事實上,AlphaStar 在這 5 場比賽的表現并非那么出色,它有時會出現一些毫無意義的操作,或者目的不明的行為,但憑借著高超的微操,依然拿下了勝利。
之后,AlphaStar 又經過了相當于 200 年的訓練和自我學習,在 12 月 19 日再次以 5:0 的完勝戰績打敗了 MaNa,并在這場比賽中展現出了更好的發揮,與更少的失誤。
在這兩場比賽中,AlphaStar 展現出了完全不遜于職業選手的操作。無論是建筑的布局,開場的偵查,還是對戰時對每個單位的走位操控都非常出色,尤其是它能夠同時在地圖上多個地點同時進行操控,這是人類選手做不到的,兩位職業選手都提到了與這樣一個超級 AI 的較量確實很頭疼,這是他們從未見過的對手。
不過在這 10 場比賽中,AI 有一個巨大的優勢,那就是凡是地圖上能看到的地方,AI 都能一覽無余,而人類必須依賴切屏才能獲取信息。
不過 MaNa 最后還是為職業選手扳回了些顏面,在今天的現場對戰中,他又和 AlphaStar 進行了一場神族內戰,取得首場也是唯一一場勝利。
在本次比賽中,AI 的 APM 被限制在 450 以內,同時也不再是全圖視野,它必須和人類一樣通過切屏來獲取信息、分析單位。比賽地圖固定為匯龍島地圖,全部為神族內戰。盡管此前贏了10局,但今天的現場對戰還是暴露了 AlphaStar 的算法存在諸多問題,最終被人類拿下一城。
MaNa 也在直播中聊到這場比賽,表示“AlphaStar 的前幾分鐘是世界級的...很難判斷 AlphaStar 在做什么,這是一次不錯的體驗” ,TLO 也表示了相同的觀點,表示和從未對戰過的 AI 對抗非常困難,與和人對抗相差甚遠。
AlphaStar 的早期學習方法與 AlphaGo 相似,它首先會通過觀看人類對戰的錄像學習人類選手的操作和戰術 ,以快速達到高段天梯玩家的水平。在這個階段的學習之后,AlphaStar 已經能夠以 95% 的勝率擊敗游戲自帶的最高級 AI 了;為了進一步的提高,AlphaStar 開始自我對戰學習, 它被分為許多種不同的版本,每個版本有不同的傾向,從而保證其多樣性,并最終獲得一個足夠智能的版本。
第一次與 TLO 對戰的是自我學習 9 天后的 AlphaStar;第二次對戰 MaNa 時則是自我學習 14 天后的版本。根據比賽后的數據分析顯示,雖然 AlphaStar 的長處并不在于 APM,事實上它的 APM 比人類選手更低,它的主要優勢還是來自于上面提到的無需操控視角,直接讀取已知地圖的所有信息。
隨后,谷歌重新設計了一個需要操作視角的 AlphaStar,經過短短 7 天訓練之后又和 MaNa 打了一局,最終落敗。但從數據分析來看,雖然自我學習的時間比上一版本短很多,但控制視角對 AlphaStar 的表現帶來的影響并沒有想象中的那么大,它的主要強大之處還是在于快速有效的決策與強大的微操。
在昨天谷歌 AI 的賽事通告發出之后,ENCE 也宣布《星際爭霸2》全球總冠軍 Serral 將在今年 2 月 15 日與 ReaktorNow 組織的《星際爭霸2》AI 挑戰賽的冠軍展開一場人機大戰。