https://frosthead.com

Турингов тест нешто мери, али то није „интелигенција“

Алан Туринг, један од очева рачунарског доба, био је изузетно паметан човек. У ствари је толико паметан да је схватио да је израз „машинска интелигенција“ готово бесмислен. Боље је, закључио је, да разговара о томе шта машина у ствари може да уради: Може ли причати? Може ли задржати разговор? Барем то можемо покушати да проучимо. Туринг је на крају предложио оно што је постало познато као „Турингов тест“: Ако судија не може да каже који је од два скривена ентитета човек, а који је вештачки, машина је „положила“ тест - управо оно прича се да се догодило прошле суботе у Лондону.

Сличан садржај

  • Силицијумска долина дугује успех овом генијалном технику којег никад нисте чули
  • Прогноза 60-годишњег Алана Туринга о узорцима у природи показала се тачним

"Поносни смо што можемо да изјавимо да је тест Алана Туринга положен први пут", рекао је један од организатора, Кевин Варвицк са Универзитета у Реадингу, када су резултати објављени. Побједнички цхатбот носи име „Еугене Гоостман“, рачунарски програм који опонаша личност 13-годишњег украјинског дјечака. "Еугене" је успео да убеди 33 одсто судија да је то човек на суботњем догађају, одржаном у канцеларијама Краљевског друштва у Лондону на 60. годишњицу Турингове смрти. (Туринг, хомосексуалац, осуђен је за грубу непристојност 1952. Године и наређено му је да се подвргне хормонском „лечењу“ као део споразума о признању кривње. Две године касније умро је од тровања цијанидом у очигледном самоубиству.)

Али, реч о опрезу је на реду. "Интелигенција" је одувек била клизава тема, а Турингов тест нарочито је дуго препун контроверзи. Туринг је описао како ће то радити у документу из 1950. под насловом „Рачунарска машина и интелигенција.“ Идеју је преузео из традиционалне викторијанске игре у салонима, где покушавате да сазнате да ли је особа скривена иза завесе мушкарац или жена, само постављањем питања. (Одговори на питања морали су да се запишу, јер би глас био предаја.) Ево како би функционирала Турингова верзија: Имали бисте судију, седећи испред две завесе, без начина да знате шта је иза њих . Иза једне завјесе је човјек; иза другог је рачунар. Судија може постављати питања било које од две скривене целине. На основу одговора, судија покушава да утврди да ли је скривени ентитет човек или машина. (Туринг је замислио да су разговори посредовани од стране машина за телетикет; данас можемо да користимо било коју врсту електронског, текстуалног интерфејса, попут врсте која се користи у интернет ћасканицама или тренутним порукама.)

Туринг је нагађао да до 2000. године „просечни испитивач неће имати више од 70 одсто шансе да направи праву идентификацију“ - односно да би компјутерски програми премештали судије 30% времена - после пет минута испитивања. Важно је „пет минута“. Туринг није говорио о временском ограничењу као својственом делу теста, и могло би се тврдити да би машина заиста могла да прође тест, она би требало да може да поднесе било коју количину испитивања. Вероватно је петоминутни критеријум био произвољно, али неопходно ограничење. 2000. година је долазила и одлазила, а цхатботови су само зауставили напредак. (У трезвенијем тренутку, одговарајући на питање ББЦ-евог анкетара из 1952., Туринг је рекао да ће проћи 100 година пре него што је машина положила тест.)

Давне 2012. године био сам судија у „Туринговом тестном маратону“, највећем икад постављеном Туринговом тесту; Одржан је у Блетцхлеи Парку у Енглеској, месту Турингова виталног дела на разбијању кода током последњих година Другог светског рата. (Организовао га је исти тим који је водио суботњи догађај, а ранија верзија Еугене-а је такође победила.) Постављање суботњег догађаја било је исто као и 2012. године: Судије су своја питања уписале у рачунар, а затим сачекали да се одговори појаве на њиховим екранима; цхатботи су, заједно са „скривеним људима“, били у другој соби, из вида.

Прво за чим сам постао хипер-свестан је да када сте судија на Туринговом тесту, пет минута прође прилично брзо. И што је краћи разговор, већа је и предност рачунара; што је дуже испитивање, већа је вероватноћа да ће се рачунар поклонити. Волим то назвати ефектом манекенке: Да ли сте се икад извинили манекенству у робној кући, претпостављајући да сте управо налетели на живо људско биће? Ако сусрет траје само делић секунде, док сте окренути обрнуто, можете замислити да сте се суочили са човеком. Што је сусрет дужи, то је очигледнија манекенка манекенке.

Исто је и са цхатботовима. Размена здравих не открива ништа - али што даље уђете у то, јавља се више проблема. Чинили су да су цхатботи склони промени теме без разлога. Често не могу да одговоре на једноставна питања. У ризику да звуче нејасно, они једноставно не звуче људски . У једном од мојих разговора 2012. године уписао сам једноставну шалу - и ентитет са којим сам разговарао одмах је променио тему у хамбургер. (Рачунарски научник Сцотт Ааронсон недавно је имао слично искуство када је разговарао са Еугенеом преко веб странице бота. Ааронсон је питао Еугенеа колико ногу има дева; он је одговорио: "Нешто између 2 и 4. Можда, три ?:-))" Касније, када је Ааронсон питао колико ногу има мрав, Еугене је искашљао потпуно исти одговор, троструки осмех и све.)

Имајте на уму и да Еугене не опонаша одраслу особу која говори енглески језик; претвара се да је млад и помало лепршав украјински тинејџер, разговарајући на прилично добром (али далеко од савршеног) енглеског. Као што је Владимир Веселов, један од програмера програма, рекао за Масхабле.цом : „Провели смо доста времена развијајући лик са веродостојном личношћу.“ Иако ће Еугене било кога ангажовати на било којој теми, његова година „чини потпуно разумним да он не зна "Не знам све." Еугене не излази одмах и не објављује своје године и националност; али открит ће га ако га затраже - и крајњи резултат може бити одређена попустљивост судија, посебно у вези са енглеском граматиком и употребом речи. (Претпостављам да је већина судија у суботу била матерњи енглески језик, мада то сигурно не знам.) Табеле би се вероватно окренуле да би Еугене икада наишао на матерњег украјинског говорника као судију.

Борба за изградњу говорне машине наглашава колико је сложени језик. То није само питање разговора - морате разговарати о нечему, а оно што кажете мора имати смисла - и мора имати смисла у контексту онога што је друга особа управо рекла. За нас је лако; за рачунаре, не толико. И тако се цхатботи ослањају на низ трикова: Меморисање мегабајта конзервираних одговора или тражење Интернета за дијалог који би могао приближити разговору у којем су тренутно. Другим речима, оно што машини недостаје интелигенције можда може надокнадити у сировој рачунарској снази. Због тога нам се Гоогле или Сири (иПхоне лични асистент) могу чинити тако паметни: Сири можда нема „ум“, али има приступ тако великој бази података, може деловати као да се чини. То је била иста врста бруталног приступа која је омогућила да ИБМ-ов „Ватсон“ победи у Јеопарди-у! у 2011.

Све ово поставља кључно питање: Шта је тачно Турингов тест мерење? Неки критичари сугеришу да је награда трик, а не интелигенција. Психолог са НИУ Гари Марцус, пишући на сајту НевИоркер.цом, каже да је Еугене успео „спровођењем низа„ плоис “дизајнираних да прикрију ограничења програма.“ Стевен Харнад, психолог и рачунарски научник са Универзитета у Квебеку у Монтреалу, био је још више скептичан, рекавши Гуардиану да је "потпуна глупост" тврдити да је Еугене прошао Турингов тест. (По својој заслузи, Туринг је био добро упознат са овим питањем; своју идеју је назвао „имитацијском игром“, а о интелигенцији је говорио тек срамотно.) Још је неспретније што је рачунар, за разлику од људског, приморан на превару. "Турингов тест је заиста тест да ли сам успешан лажљивац", рекла ми је Пат Хаиес, информатичарка из Института за људску и машинску когницију у Пенсацоли, Флорида, после Туринговог маратона Туринга 2012. године. "Да имате нешто што би заиста могло да прође Турингову игру имитације, била би то врло успешна 'људска мимика'".

А "људска" је друга кључна тачка: није ли могуће да на свету постоје и друге врсте интелигенције, изван оне врсте коју показује наша врста? Заиста интелигентна машина имала би безброј практичних примена, али зашто се фокусирати на стварање више „људи“? Напокон, већ имамо доста људи. Као што је лингвиста Ноам Цхомски нагласио, када тежимо да изградимо машину која се креће под водом, од ње не захтевамо да „плива“ - а подморница није ништа мање од постигнућа због своје неспособности да направи леђни ударац.

Да, Еугене је импресиван, барем у малим рафалима. Па ипак, чак и најбољи цхатботи наилазе на питања са којима би дете које је било пола Еугенеове претваране године могло вешто да реши. Можда није изненађујуће што већина истраживача АИ проводи мало времена опседнута Туринговим тестом. Машинска интелигенција се, наиме, креће напријед и то прилично брзо. Софтвер за превођење гласа на текст, који је био прилично патетичан пре само неколико година, брзо се побољшава, као и програми за превођење језика. Амазон често има прилично добру представу о томе шта желите да купите и пре него што то учините. А Гоогле-ов аутомобил за само вожњу био би пука фантазија пре десетак година. Али разговор, док стално откривамо, заиста је тежак и вероватно неће бити граница на којој АИ најјаче сија. За сада, ако тражите некога за разговор, препоручујем правог човека.

Дан Фалк је научни новинар са седиштем у Торонту.

Турингов тест нешто мери, али то није „интелигенција“