ДА ЛИ РАЧУНАРСКИ МОДЕЛ МОЖЕ ДА ПРЕДВИДИ ПРВО КОЛО ОВОГОДИШЊЕГ МАРШ ЛУДИЛА? | ИНОВАЦИЈА | СМИТХСОНИАН - ЧЛАНЦИ, ИНОВАЦИЈЕ, ТЕХНОЛОГИЈА

"Пазите се на март марта." Да, коначно је поново доба године: када цареви колеџке кошарке морају да гледају леђа, да не би погодили семе нижег дна турнира.

Пре 15. марта, милиони широм света ће попунити заграде за март Маднесс. У 2017. години, ЕСПН је добио рекордних 18, 8 милиона заграда.

Први корак ка савршеном носачу је правилно одабир прве рунде. На жалост, већина нас не може предвидети будућност. Прошле године само 164 пријављених заграда било је савршено кроз први круг - мање од 0, 001 процента.

Поднесено је 18, 8 милиона заграда.

164 су савршени после 1. кола.

Ево превладавања. #перфецтбрацкетватцх пиц.твиттер.цом/ТГвЗНЦзСнВ
- ЕСПН Фантаси Спортс (@ЕСПНФантаси) 18. марта 2017

Многи заграде се распадају када тим са нижим семеном узнемири преферирано више семе. Откад се поље 1985. године проширило на 64 тимова, годишње се догоди најмање осам напада. Ако желите да освојите свој брацкет поол, боље је да одаберете најмање неколико надокнада.

Ми смо два доктората из математике. кандидати на Државном универзитету Охајо који имају страст за науку о подацима и кошарку. Ове године смо закључили да би било забавно изградити рачунарски програм који користи математички приступ да би предвидио првокласне надокнаде. Ако смо у праву, заграда изабрана помоћу нашег програма требало би да делује боље током првог круга од просечног.

Погрешиви људи

Није лако препознати која ће од утакмица из првог круга изазвати узнемиреност.

Реците да морате да одлучите између броја 10 и семена бр. 7. 10 носиоца је покренула надокнаде у своја претходна три турнирска наступа, једном чак и одрадивши Финал Фоур. Семе бр. 7 је тим који је добио мало или нимало националног обухвата; повремени обожаватељ вероватно никада није чуо за њих. Које бисте изабрали?

Да сте изабрали семе број 10 у 2017. години, отишли бисте са Универзитетом Виргиниа Цоммонвеалтх преко Саинт Мари'с оф Цалифорниа - и грешили бисте. Захваљујући погрешности у одлучивању која се назива пристраност примања, људи могу бити натерани да користе своја најновија запажања за доношење одлуке.

Пристраност пристојности је само једна врста пристраности која може ући у нечији поступак бирања, али постоје и многи други. Можда сте пристрани према свом домаћем тиму, или се можда поистоветите са играчем и очајнички желите да он или она успе. Све ово утиче на ваш носач на потенцијално негативан начин. Чак и искусни професионалци упадају у ове замке.

Моделирање узнемиравања

Машинско учење може се бранити од ових замки.

У машинском учењу статистичари, математичари и рачунарски научници обучавају машину да праве прогнозе пуштајући је да "учи" из прошлих података. Овај приступ се користи у многим областима, укључујући маркетинг, медицину и спорт.

Технике машинског учења могу се упоредити са црном кутијом. Прво, унесете претходне податке алгоритма, у основи постављајући бројчанике на црну кутију. Једном када су подешавања калибрирана, алгоритам може очитати нове податке, упоредити их са прошлим подацима и затим испљунути своја предвиђања.

Црни оквир алгоритама машинског учења. (Маттхев Осборне, ЦЦ БИ-СА)

У машинском учењу доступне су различите црне кутије. За наш март Марцх Маднесс, они које смо желели познати су као алгоритми за класификацију. Они нам помажу да утврдимо да ли игра треба класификовати као узнемиреност или пружањем вероватноће да се узнемири или експлицитним класификацијом игре као једне.

Наш програм користи бројне популарне алгоритме класификације, укључујући логистичку регресију, случајне моделе шума и к најближе комшије. Свака метода је попут различитог „бранда“ исте машине; они раде под хаубом као Фордс и Тоиота, али обављају исти посао класификације. Сваки алгоритам, или кутија, има своја предвиђања о вероватноћи да ће доћи до поремећаја.

Користили смо статистику свих тимова из првог круга од 2001. до 2017. за подешавање бројчаника на нашим црним кутијама. Када смо тестирали један од наших алгоритама на основу података о првом кругу 2017. године, имао је око 75 процената успеха. То нам даје сигурност да анализа прошлих података, умјесто да само вјерујемо у цријева, може довести до тачнијих предвиђања поремећаја и тако до бољих укупних заграда.

Које предности имају ове кутије над људском интуицијом? За једно, машине могу у неколико секунди препознати обрасце у свим подацима за период 2001-2017. Штавише, будући да се машине ослањају само на податке, можда је мање вероватно да ће пасти за људске психолошке пристраности.

То не значи да ће нам машинско учење дати савршене заграде. Иако кутија заобилази људску пристраност, није имун на грешку. Резултати зависе од прошлих података. На пример, ако би семе бр. 1 изгубило у првом кругу, наш модел то вероватно не би предвиђао, јер се то никада раније није догодило.

Поред тога, алгоритми машинског учења најбоље раде са хиљадама или чак милионима примера. Само 544 игре у првом кругу марта Маднесса су одигране од 2001. године, тако да наши алгоритми неће правилно позвати сваку узнемиреност. Сјајни кошаркашки стручњак Јален Росе, наш производ би требао бити кориштен као алат у комбинацији са вашим стручним знањем - и срећом! - да изаберете исправне игре.

Машинско учење лудила?

Нисмо први који су примењивали машинско учење на мартовско лудило и нећемо бити последњи. У ствари, технике машинског учења можда ће ускоро бити потребне да би ваш носач био конкурентан.

Не треба вам диплома математике да бисте користили машинско учење - иако нам то помаже. Ускоро ће машинско учење бити приступачније него икад. Заинтересовани могу погледати наше моделе на мрежи. Слободно истражите наше алгоритме и чак сами смислите бољи приступ.

Овај чланак је првобитно објављен у часопису Тхе Цонверсатион.

Маттхев Осборне, кандидат за математику на Државном универзитету Охио

Кевин Новланд, кандидат за математику на Државном универзитету Охаја