Универзални преводилац је дуго времена био опсесија поп културе. Стар Трек представља га као ручну машину, подсећа на микрофон, који може превести већину језика одмах . Водич за аутостопију Галаки-ом обилује бабиловском рибом, створењем које, кад заглави у уху, нуди тренутни превод било ког језика у галаксији.
Стога не би требало бити изненађење да данашњи људи покушавају да направе уређај који подједнако добро функционише. Постоје десетине апликација за паметне телефоне, али већина преводи речи на једноставан, један на један; корисник откуца или изговара неку реч, а апликација се одбија са преводом. Сада је циљ и прави монетарни налет да инжењери и предузетници омогуће двема особама да разговарају на различитим језицима, док мали уређај избацује преводе у реалном времену.
Постојеће апликације за превођење
На путовању у Грчку, Андрев Лаудер се разболио од енглеског језика.
„Отишао сам у апотеку и нису разумели ниједан енглески језик, тако да нисам добио лекове“, каже Лаудер, извршни директор Воцре Транслатеа. Етикете на дрогама биле су му буквално грчке. Језичке баријере су уобичајене за светске путнике. У страној држави мале трансакције попут куповине лекова или добијања упутстава - још једне потешкоће с којом се Лаудер суочио - постају херкулоски задаци.
Када се вратио у страну, Лаудер је креирао Воцре Транслате, апликацију за превођење гласа и текста. Све је почело као апликација текст-у текст (која се зове МиЛангауге), а затим се у почетку трансформирала у модел говора у текст који је, попут других апликација укључујући СаиХи Транслате, користио традиционални модел у којем реч директно прелази на другу реч. Реците „Здраво“, а паметни телефон или таблет се поново активира „Хола“. „Збогом“ постаје „Саионара“. И тако даље, слично као преводилац текста.
Да би створили једноставан аудио превод, творцима ових апликација потребни су подаци. Воцре је своје податке извлачио из јавних снимака и докумената, попут старих филмова или јавних расправа. „У основи смо молили услугу транскрипције говорне поште да нам дозволи да користимо њихов облак за препознавање говора“, каже извршни директор СаиХи Лее Боссиер.
Једном када су инжењери добили аудио и текстуалне податке, упарили су звук и текст, реч за реч. Софтвер за препознавање гласа препознаје "сир" и претвара га у текст. То је претворено у француски језик, а апликација проналази француски изговор за „фромаге“.
То би могло рећи, ако корисник нервозно назива нешто "сировим", преводилац не ради тако добро, јер говорни језик није ни приближно тако статичан као писмени језик. Каденца, сленг, флекција, изговор, дијалект и разговорни ток могу променити значење
С временом је, међутим, Лаудер желио више разговорни уређај. У поруци е-поште, каже: „На основу података о употреби установили смо да људи говоре сасвим другачије од начина на који пишу. Говорна реч је много спонтанија и много мање формална и дословна. “Дакле, он је користио статистички машински превод, приступ који користи и Гоогле који користи податке да би пронашао уобичајену употребу речи, преносећи традиционални модел превођења са речи на реч. У основи, Воцре учи како се користи. „Учи се на основу сваког разговора, сваке фразе која прође кроз њега. То је нешто што временом постаје паметније “, каже Лаудер.
Ипак, тренутно је обема апликацијама потребно неколико секунди за превођење, али су несумњиво ефикасне, посебно у складу са говором тела, за трансакцијске разговоре попут наручивања оброка. На крају, људи већ годинама наручују храну на непознатим језицима и увек успевају да једу. Али они нису могли да воде дубинске, сложене разговоре.
Са Воцре и СаиХи, разговори могу тешко да се крећу, али то није исто што и ћаскање на вашем матерњем језику. Гоогле намерава да то у потпуности промени.
Гоогле-ов приступ (Статистички машински превод)
Када учимо нови језик у школи, започињемо с појмовима појединачних вокабулара. Али језик је флуиднији - речи требају контекст.
„Приступ [Гоогле] заузима опћенитији је приступ, “ каже Јосх Естелле, софтверски инжењер за Гоогле Транслате. "Уместо да покушавамо да кодирамо сва ова правила, правила покушавамо да научимо гледајући податке."
Технолошка компанија избегава методу један по један, реч по реч, и уместо тога користи статистички машински превод, не гледајући шта значе речи, већ како се моделира језик, што се учи преко података . Дакле, циљ је шума, а не дрвеће. Пример енглеског језика: знамо дефиниције речи „бреак“ и „уп“. Али фраза „бреак уп“ није дословна комбинација две речи.
Статистички машински превод захтева податке. Планине тога. Да би метода функционисала, не треба само чињеница да је "поријекло" француски за сир, већ 100 примера и "поријекла" и сира који се користи у стварним реченицама.
Естелле каже да ако говорник енглеског језика има два менија, идентична осим у чињеници да је један штампан на енглеском, а други на кинеском, „вероватно можете схватити шта је кинески знак за„ супу “.“ Контекст је краљ. Али да бисте створили тај контекст, потребан вам је милион менија и сваки други документ који се може замислити.
То је управо оно што Гоогле има. Без веб гиганта који би прикупио гомилу података, Бабел риба у стварном свету не би могла постојати. Пази по вебу и прикупља све - текст и звук. Затим податке уноси у алгоритме који све упоређују са свим осталим. Ове поређења помажу да се дође до корена како језик природно делује.
„Једна ствар која изненађује људе када говоримо о Преводу је да наш тим нема језикословце“, каже Естелле. „Покренули смо 71 језик и рекао бих да наш тим не зна како да говори огромну већину њих. Људски преводитељ неће моћи да научи све ове појмове и ствари онолико брзо колико наши [подаци] могу да науче са веба. "
Која је поента?
Као Гоогле, и Фацебоок види предности. Размотрите прелазак на сајт друштвених медија.
„Мисија Фацебоока је повезивање целог света, а једна од препрека за повезивање света није да сви говоре истим језиком“, каже Том Стоцки, директор инжењеринга у Фацебооку. "Са стране превода, мислим да је заиста амбициозна визија будућности да ли бисте могли да користите Фацебоок на свом матерњем језику и комуницирате са било којим другим језиком."
Прошлог августа Фацебоок је купио Јиббиго, апликацију за превођење од говора до говора која је доступна за Андроид и иОС уређаје.
Одушевљени корисници Фацебоока приметиће да на друштвеној страници већ постоји неки превод. Ако сте икада на вашој страници са енглеским језиком имали шпански пост, одмах сте добили прилику да га преведете на свој матерњи језик.
Али Стоцки гласовну компоненту види као потенцијални мењач игара. Успон паметних телефона и таблета поздравља стално повезани свет, а пораст софтвера за препознавање говора позива на нова средства веб интеракције. Стоцки предвиђа будућност у којој корисници могу само да говоре команде својим паметним телефонима и комуницирају са другим корисницима, осим што постоје језичне разлике.
"Нема питања која ће се на крају догодити, јер су једина ограничења снага језичког мотора и наравно време обраде и моћ обраде", каже он.
Лаура Мурпхи, професорица на одсеку за глобалне здравствене системе и развој на Универзитету Тулане и призната технолошка скептичарка, доводи у питање вредност универзалног преводиоца и не мора знати више од једног језика.
Она сматра да би уређај могао бити помало користан у путовањима, пословним и међународним односима, али не и револуционарно. На одређеном нивоу већ имамо преводиоце (људе) на месту, а већина који раде у страним односима знају одговарајуће језике. Уређај, верује Мурпхи, могао би да има негативне последице.
"Мислим да то може учинити људе лењовима", каже Мурпхи. Превођење језика може бити ментално тешко ако присилите мозак - нарочито онај који зна више од два језика - да ради на другачији начин, али вежба је ипак корисна. Мозак се повлачи са места језичке емпатије до кога чак ни најбољи говорни преводилац није могао доћи.
Иако би ова универзална комуникација могла бити позитивна, Мурпхи признаје, "то би могло довести до тога да људи мисле како комуницирају кад нису." Култура није увијек у потпуности утјеловљена у језику (узмите на примјер сарказам), а комуникација није увек о информацијама које се преносе.
Када можемо очекивати да видимо ову технологију?
„У 2005. било нам је потребно 40 сати да преведемо 1.000 реченица“, каже Естелле из Гооглеа. "Данас преведимо еквивалент од 1.000 реченица сваких 10 милисекунди."
Као што Рицхард Андерсон славно каже у ТВ серији „Шест милиона долара “ из 1970-их, „Ми имамо технологију.“ Сада се само чека на прикупљање и анализирање података. Колико ће то трајати остаје непознато, преноси Естелле. Али опрезне процене стављају такав уређај у наше руке у року од деценије.
Иако креатори апликација попут Боссиер-а или гигантских компанија попут Гоогле-а и Фацебоок-а не желе да граде сопствене верзије Библијске вавилонске куле, она ипак жели да стане на крај бабању. Предвиђа свет у којем сви комуницирамо, о медицини, о политици, о идејама.
А, тај свет можда и није далеко.
Напомена уредника: Ажурирали смо ову причу 4. априла 2014, како бисмо прецизно описали технологију Воцре Транслатеа.