https://frosthead.com

Најновија АИ научава да се игра без икакве људске помоћи

Прошле године програм вештачке интелигенције под називом АлпхаГо који је створио Гооглеов тим ДеепМинд победио је људског првака у Го-у, древној кинеској стратегијској игри која је у много чему сложенија од шаха. Како је Емили Матцхар известила за Смитхсониан.цом у то време, то је било запањујуће достигнуће, будући да су већ 1997. неки људи предвиђали да ће бити потребно 100 година да би рачунар на Го-у претукао човека.

Иако је подвиг импресиван, АлпхаГо је научио играти игру анализирајући претходне игре које су играли људи. Али како извештава Меррит Кеннеди из НПР-а, нова верзија вештачке интелигенције под називом АлпхаГо Зеро смислила је како да савлада игру самостално, без људског доприноса или манипулација - напредак који има велике последице за будући развој АИ.

Према саопштењу компаније ДеепМинд, претходне верзије АлпхаГо-а научиле су да играју игру проучавањем мечева између професионалних и јаких аматерских играча, усвајајући правила игре и успешне стратегије игре. АлпхаГо Зеро, међутим, није гледао ниједну игру коју су играли људи. Уместо тога, дата су јој правила игре, а затим играли против себе, користећи појачање како би се научили исправним и погрешним потезима и дугорочним стратегијама. Док је АИ играо игру, ажурирао је своју напредну неуронску мрежу како би боље предвидио потезе свог противника.

Истраживачи су посматрали како АИ савладава игру у реалном времену. После три дана успела је да савлада претходну верзију под називом АлпхаГо Лее, која је победила корејског Го господара Лее Седол-а у 4 од 5 игара 2016. године. После 21 дана победио је АлпхаГо Мастер, верзију која је победила 60 најбољих Го играча у мрежи и Најбољи играч света Ке Јие раније ове године. Најновија верзија је свладала АлпхаГо Мастер 100 игрица на 0. Након 40 дана достигла је нивое игре коју нико до сада није видео. Истраживање се појављује у часопису Натуре.

„У кратком временском року, АлпхаГо Зеро разуме све знање о Го-у које су људи сакупили током хиљада година играња“, каже водећи истраживач Давид Силвер из Гоогле-овог ДеепМинд-а у Иоутубе видеу. "Понекад је заправо изабрано да прекорачи то и открије нешто што људи у овом временском периоду још нису ни открили и открили нова дела знања која су на много начина креативна и нова."

Како извештава Агенце Франце-Прессе, АлпхаГо Зеро достигао је овај ниво мајсторства много ефикасније од својих претходника. Док је претходна итерација имала 48 јединица за обраду података и играла је 30 милиона тренинг тренинга током неколико месеци, Зеро је имао само 4 процесне јединице и играо је 4, 9 милиона тренинг тренинга током три дана. "Људи имају тенденцију да претпостављају да је машинско учење све о великим подацима и огромним количинама рачунања, али заправо оно што смо видели са АлпхаГо Зеро-ом је да су алгоритми много већи", каже Силвер за АФП.

Али истраживање је више од само савладавања игре на плочи. Како извјештава Иан Сампле из Тхе Гуардиан- а, ова врста табуле расе или празан шкриљац, учење би могло довести до нове генерације умјетне интелигенције опће намјене која би могла помоћи у рјешавању проблема у пољима која се могу добро симулирати у рачунару, попут састава лијекова, савијање протеина или физика честица. Изграђујући своје знање из темеља без људских пристраности или ограничења, алгоритми би могли ићи у правцима у којима људи још нису размишљали да гледају.

Док многи људи у АИ заједници виде АлпхаГо Зеро као велико достигнуће, Гари Марцус, професор психологије са Универзитета у Њујорку који се специјализовао за вештачку интелигенцију, каже за НПР Кеннеди да не мисли да је алгоритам заиста табула раса, јер је претходно познавање људи у конструкцију алгоритма. Такође не мисли да је табула раса АИ толико битна колико се чини. "[У] биологији, стварни људски мозак није табула раса ... Не видим главни теоријски разлог зашто бисте то требали учинити, зашто бисте се требали одрећи многих знања која имамо о свету", каже он.

Упркос томе, брзо господарење игром Алпха Го је импресивно - и помало застрашујуће.

Најновија АИ научава да се игра без икакве људске помоћи