АИ УЧИ ТИМСКИ РАД ДОМИНИРАЈУЋИ У МУЛТИПЛАИЕР ВИДЕО ИГРАМА

Рачунари доминирају људима у играма један на један попут шаха већ деценијама, али добијање вештачке интелигенције (АИ) за сарадњу са саиграчима је мало замршеније. Сада су истраживачи Гоогле-овог ДеепМинд пројекта научили АИ играче да раде заједно у тимовима како са људима тако и са другим рачунарима како би се такмичили у видеотеци Куаке ИИИ Арена из 1999. године.

Едд Гент из Сциенце-а извештава да када АИ има само једног противника, обично делује прилично добро јер само предвиђа могуће потезе једног ума. Али тимски рад је сасвим другачија ствар, јер укључује радње у којима рачунари традиционално нису добри, попут предвиђања како ће се понашати група саиграча. Да би АИ био заиста користан, мора научити како сарађивати са другим интелигенцијама.

Гоогле-ов ДеепМинд тим објашњава у посту на блогу:

„Милијарде људи насељавају планету, сваки са својим индивидуалним циљевима и акцијама, али још увек способни да се окупе кроз тимове, организације и друштва у импресивним приказима колективне интелигенције. Ово је поставка коју називамо учењем више агената: многи појединачни агенти морају деловати независно, а опет научити да комуницирају и сарађују са другим агентима. Ово је неизмерно тежак проблем - јер се са агентима који се прилагођавају свет се непрестано мења. "

Мултиплаиер, видео игре за прво лице, у којима тимови играча трче по виртуелним светима, обично пуцајући из једног оружја или из бацача граната, савршено је место за АИ да научи ситнице тимског рада. Сваки играч мора понашати се понаособ и доносити изборе који ће бити од користи целокупном тиму.

За студију, тим је тренирао АИ да игра зароби заставу на платформи Куаке ИИИ Арена . Правила су прилично једноставна: две екипе се суочавају на бојном пољу попут лавиринта. Циљ је ухватити што већи број осталих тимова виртуалних застава, истовремено штитећи сопствене, а било који тим забележи највише застава у пет минута победе. У пракси, међутим, ствари могу брзо да се искомпликују.

Тим ДеепМинд створио је 30 алгоритама неуронске мреже и натерао их да се међусобно боре на низу насумично генерисаних игара карата. Ботови су постизали бодове хватајући заставе и запомажући друге играче, враћајући их назад у поново постављени простор где се њихов лик поново покреће. У почетку су се радње ботова чиниле случајним. Међутим, што су више играли, бољи су постали. Све неуронске мреже које су константно изгубиле елиминисане су и замењене модификованим верзијама победе АИ На крају 450.000 игара, тим је крунирао једну неуронску мрежу - названу Фор тхе Вин (ФТВ) - као шампион.

Група ДеепМинд је играла алгоритам ФТВ против онога што се назива зрцалним ботовима, којима недостају вештине учења АИ, а затим и против људских тимова. ФТВ је срушио све изазиваче.

Група је тада одржала турнир на којем је 40 људи играло насумично подређено како саиграчи, тако и противници робота. Према посту на блогу, људски играчи открили су да су роботи сарађивали од својих саиграча из стварног живота. Људски играчи упарени са ФТВ агентима успели су да победе сајбер ратнике у око 5 процената мечева.

Како су сазнали, ботови су открили неке стратегије које су дуго прихватили људски играчи, попут дружења у близини тачке са поновним спавањем заставе како би је зграбили када се поново појави. ФТВ тимови су такође пронашли бугу коју би могли искористити: ако су упуцали свог тимског колегу у леђа, то им је појачало брзину, нешто што су користили у њихову корист.

„Оно што је током развоја овог пројекта било невероватно је видети појаву неких од тих понашања на високом нивоу“, каже истраживач ДеепМинд-а и главни аутор Мак Јадерберг. „То су ствари са којима можемо да се односимо као људски играчи.“

Један од главних разлога зашто су момчади били бољи од људских играча је тај што су били брзи и прецизни стрелци, што их чини бржим на жребу од њихових људских противника. Али то није био једини фактор њиховог успеха. Према блогу, када су истраживачи уградили у четвртини секунде одложено време реакције у роботе-стрелице, најбољи људи су их још увек могли победити око 21 проценат времена.

Од ове почетне студије, ФТВ и његови потомци ослобођени су на пуном бојном пољу Куаке ИИИ Арене и показали су да могу савладати још сложенији свет са више опција и нијанси. Такође су створили робота који одликује ултра сложену стратегијску свемирску игру Старцрафт ИИ.

Али истраживање није само у стварању бољих алгоритама за видео игре. Учење о тимском раду могло би на крају помоћи АИ-у да ради у возним парковима аутомобила који возе самостално или можда једног дана постану роботски асистенти који помажу у предвиђању потреба хирурга, објавио је Сциенце'с Гент.

Међутим, не мисле сви да ботови са аркадним звездама представљају прави тимски рад. Истраживач АИ Марк Риедл из Георгиа Тецх-а каже за Нев Иорк Тимес да су роботи тако добри у игри, јер сваки разуме стратегију дубински. Али то није нужно сарадња будући да АИ тимовима недостаје један кључни елемент људског тимског рада: комуникација и намерна сарадња.

И, наравно, недостаје им и други знак кооперативног искуства са видео играма: смеће разговарајући са другим тимом.