Софтвер за препознавање гласа, који би се већина нас вероватно сложила, прилично је цоол ствар. Али разговор са машинама је део - било да је то паметни телефон, ТВ екран или контролна табла - па и не толико. Питате савет за неки уређај? Реекс геек. Изговарање сваке речи да бисте били разумљиви? Колико стварно можеш бити кул?
Али Аппле, тачно у облику, преузео је ово место ангажујући три иконе цоол да би глумили у својој последњој рекламној кампањи за Сири, глас за иПхоне 4С. Ту су Зооеи Десцханел (Адорабле Цоол) и Јохн Малковицх (Церебрал Цоол) и Самуел Л. Јацксон (Ултимате Цоол), и сви се они који се баве игром речи и телефоном изгледају као спорт богова.
Критичари, међутим, истичу да Сири у стварном животу није ни тако одзивна нити свезнајућа каква је представљена у рекламама. И ви сте сигурни да сте то шокирани. Други виде целу ствар као зрелу за пародију - виде Зооеиевог брата Јооеи-а да заједно раде смешну или Дие верзију Зооеи-овог и Сиријиног кишног дана.
Нема везе. Сири је постала водећа певачица у хору робота, гласом „Иоу Гот Маил“ нове генерације.
Модерно је у неким круговима сугерирати да Сири није Стеве Јобс достојан, да би он још био жив, Јобс би га повукао с тржишта или, у најмању руку, никада не би одобрио тако висок профил кампања за тако погрешан производ.
Али како је рекао Јоков наследник Тим Цоок раније ове недеље, власници иПхонеа 4С воле Сири. Према истраживању објављеном у марту, скоро 90 процената каже да их користи најмање једном месечно. И имајте на уму да Сири, један од ретких Аппле-ових производа за који се прича да је у бета верзији када је пуштен, неће прославити свој први рођендан до октобра. Још увек учи језик и, што је још важније, тек почиње да потенцира потенцијал вештачке интелигенције.
Сири ће вероватно бити средишњи део Аппле ТВ-а, за који се очекује да ће дебитовати у децембру. Али велике су шансе да је место где ће разговори са машинама ићи у главни ток у нашим аутомобилима.
Вози, рекла је
Наравно, то се већ дешава, али морате да пређете на говор робота ако желите да будете разумети. Па чак ни тада нема гаранције. То ће се почети мењати овог лета када ће се неки нови модели опремити нечим што се зове Драгон Дриве!
То је изум компаније Нуанце Цоммуницатионс, компаније са седиштем у Масачусетсу, која је постала моћ у послу са препознавањем гласа. (Опште се верује да су мозак иза Сири.) Нуанце и препознавање гласа у аутомобилима доживели су велики корак напред прошле недеље када је компанија објавила да је Драгон Дриве! моћи ће да се додирне у облаку.
То значи да ће систем драматично повећати своју рачунарску снагу и способност меморије. А то значи да ће глас на вашој контролној табли постати више сиријски и омогућити вам да заправо разговарате с њим. Нема више моносилног викања. Долази дан када ћете моћи да случајно напоменете да се осећате као неки Аллман Бротхерс и неколико секунди касније „Вхиппинг Пост“ ће доћи пуштати кроз звучнике.
Кључно је колико смо способни да научимо машински контекст и прагматику - како се језик користи у друштвеним ситуацијама. А то је лукав посао. За почетак, чак и најсавременији уређај за препознавање гласа мора да сачека да човек заврши говор како би могао да анализира и протумачи читаву реченицу. Затим постоји „теорија ума“, способност разумевања да други људи могу имати другачија уверења и намере од наших сопствених. Колико знамо, само људи то могу учинити.
Недавна студија двојице Станфордских психолога може вам дати осећај шта је све укључено у помагање машинама у интуицији. Истраживачи Мицхаел Франк и Ноах Гоодман поставили су интернетски експеримент у којем су учесници замољени да погледају низ објеката, а затим одаберу који ће од њих бити одређена ријеч. На пример, једна група учесника видела је плави квадрат, плави круг и црвени квадрат. Питање за ту групу било је: Замислите да разговарате са неким и да желите да се обратите средњем објекту. Коју реч би користио, „плави“ или „круг“?
Друга група је била упитана: Замислите да неко разговара са вама и користи реч "плава" за означавање једног од ових објеката. О ком предмету разговарају?
Одговори су помогли истраживачима да добију јаснију слику о томе како слушалац разуме говорника и како говорник одлучује шта да каже. Из тога су развили врсту математичког модела који може проширити и оплеменити мисаони процес рачунара.
Рекао је Франк: "Проћи ће вам године рада, али сан је рачунар који стварно размишља о ономе што желите и шта мислите, а не само о ономе што сте рекли."
Начин говора
Ево неких новијих дешавања у препознавању гласа:
- Сири шути: ИБМ има тенденцију да буде јако нервозан због корпоративне тајне од изласка, па сада забрањује својим запосленима да користе јавне странице за пренос датотека, попут Дропбок-а. Али такође има забрану употребе Сири у канцеларији, јер се заштитни извршиоци брину да би неко, док је разговарао са њиховим телефоном, могао открити осетљиве информације које се завршавају на Аппле-овим серверима.
- Узмите то, Аппле !: Самсунг је ове недеље представио свој нови Галаки Кс ИИИ паметни телефон у Лондону, а иако његов велики екран осетљив на додир добија велику пажњу, он такође садржи нови софтвер за препознавање гласа и лица.
- Уради оно што кажем, а не оно што радим: И Самсунг се ту не зауставља. Недавно је поднео патентну пријаву за робота који разуме људски говор. Робот ће моћи да прилагоди своје могућности слушања тако да узме у обзир амбијентални шум који може прекинути или пореметити наредбе које су му дате. Такође би било у стању да препозна ко му говори, чак и ако је бука у позадини врло гласна.
Инфографски бонус: Мислите да је ваш аутомобил сада аутоматизован. Сачекајте док се потпуно не укључи у Интернет. Откријте шта може повезати аутомобил.