https://frosthead.com

Како Гоогле чува нежељену пошту из пристигле поште

Иза свих Гооглеових информација о крцању информација - од проналажења резултата претраге који су најважнији, до читања и задржавања картица на вашој е-пошти - стоји нека занимљива математика. А недавно је Јавиер Тордабле, софтверски инжењер, одржао презентацију на којој је отворио прозор у генијалан Гоогле свет.

Кренимо од Гмаил-а. Понекад добијете нежељену пошту, али Гмаил је прилично добар у проналажењу тога да, када дописник покушава да вас натера да инвестирате у нигеријског принца, вероватно не желите тај део поште у вашем сандучићу. Како то зна? Први корак: обучите машину. Други корак: покрените то да ради.

То се назива машинским учењем, а Гоогле то ради много. У првом кораку, морате учинити оно што рачунарски научници називају „карактерисати инстанцу“. У математичком говору то значи:

Опћенито, карактеристике инстанције могу се сматрати елементима у вектору дводимензионалног еуклидског простора за велики н (100-1000 димензија је нормално, 1М-10М није нечувено)

Али ево како размислити о томе ако сте престали са математиком након Цалц 1. Гмаил може извући неколико кључних информација из било које одређене адресе е-поште. Колико је то дугачко? Колико великих слова постоји? Да ли је то од некога од кога сте раније добили е-пошту? Не желите да информације потребне за доношење одлуке буду превише тешке за добијање или бављење, јер ће то успорити и умањити тачност ваше машине. Тако Гоогле црта линију на основу онога што зна о нежељеној пошти. Е-поруке које прођу падају с једне стране линије, а нежељене с друге стране.

Више математике говори:

Једноставни модел класификације је хиперплана у простору карактеристика. Примјери података на једној страни хиперплане класифицирани су као ваљане поруке е-поште, а инстанце на другој страни класифициране су као нежељена пошта.

Шта је са претрагом гласа - такође се назива и аутоматизовано препознавање говора или АСР? Као и машинско учење, АСР се дешава у два дела: обрађује звук који долази и схвата шта говорите. Први део укључује Фоуриер-ове трансформације, које изолирају важне битове које рачунар може превести. Други део је моделирање говора користећи се „скривеним Марковим моделом“.

У овом моделу стања су слова поруке, а редослед догађаја је звучни сигнал. Витерби алгоритам може се користити за добијање редоследа стања максималне вероватноће.

Гоогле би волео да препознавање гласа буде боље и лакше. У овом случају, група Гоогле пиштоља пише:

Циљ на Гооглеу је да говорни приступ свеприсутно буде доступан. Жељели бисмо допустити кориснику да одабере - требали би бити у могућности да схвате здраво за готово да је говорна интеракција увијек опција. Постизање свеприсутности захтијева двије ствари: доступност (тј. Уграђена у сваку могућу интеракцију гдје унос или излаз говора могу имати смисла) и перформансе (тј. Дјелују тако добро да модалитет интеракцији не ствара трење).

Друга област у којој Гоогле користи математику налази се у њиховим мапама - у центру пажње недавно, након што је Аппле дебитовао у њиховом систему мапирања до значајних критика. У срцу Гоогле Мапс је основна теорија графова - математика преласка са једног места на друго током путовања на најкраћем растојању. Али, наравно, сложенији је од тога. Запањујуће пише: „Један јединствени проблем је што графови који се користе у Гоогле мапама садрже милионе чворова, али алгоритми се морају изводити у милисекундама.“

Гоогле нам неће рећи како то раде. Иначе Аппле не би наишао на свој проблем, али основе укључују померање Дијсктра алгоритма (вероватно најчешће коришћени алгоритам претраживања графова). Пре неколико година, рачунарски научници са Универзитета у Карлсрухеу описали су нови начин за рангирање упита за постизање бржих резултата. Они су написали:

Наш алгоритам обрађује осмерознаменкасти број чворова потребних за мапе САД-а или западне Европе у неколико сати користећи линеарни простор. Најкраћи (тј. Најбржи) упити за пут тада требају око осам милисекунди да бисте произвели тачно најкраће стазе. То је око 2.000 пута брже од коришћења алгоритма Дијкстра.

Тордабле пролази кроз бројне друге математичке алате које користи Гоогле, укључујући оне укључене у Гоогле књиге, слике претраживања, аналитику, ИоуТубе, Гоогле преводилац, Гоогле Еартх и Пицасу. Овде можете видети цео сет слајдова.

Више са Смитхсониан.цом:

Смитхсониан добија Гоогле пресликане
Пратите трендове у храни помоћу Гоогле књига

Како Гоогле чува нежељену пошту из пристигле поште