https://frosthead.com

Кориштење математике за испитивање иранских резултата избора

Статистичари и политолози одржавају дан на терену са резултатима иранских избора почетком овог месеца. Да ли су избори били лажни? Можда никада нећемо знати, али довољно је тога што је закопано у математици да бисмо помислили да је то можда тако. Чак и тада, има нас и довољно да поверујемо да је све легално. Ево неколико анализа које су ми се учиниле посебно занимљивим:

Чисти подаци

Одмах након избора појавиле су се сумње у легитимност података јер сваки пут када се објави нова серија резултата гласања (они излазе у деловима у Ирану, слично као у Сједињеним Државама), проценат гласова иде председнику Махмуду Ахмадинеџаду било је исто: 67 процената. Подаци обично нису чисти, а неки су се почели питати да ли су резултати измишљени.

Анализа професора математике са Универзитета у Висконсину, Јордана Елленберга из Слатеа, међутим, дубље је ушла у податке како би показала да је заправо много месиран него што се могло очекивати. Резултати нису излазили град по град, већ у великим серијама које су комбиновале податке из неколико области, што је значило да су укупни гласови Ахмадинеџада били просечни. А закон великих бројева диктира, као што је Елленберг написао:

Просеци веома различитих количина могу и обично дају резултате који изгледају готово савршено уједначено. С обзиром на довољно података, преваранти се обично једно друго отказују.

Елленберг закључује да су подаци "дефинитивно довољно забрљани да су тачни."

Бенфордов закон

Неколико анализа прегледало је прве цифре резултата избора у Ирану како би утврдили да ли су у складу са Бенфордовим законом, а то је:

У листама бројева из многих (али не свих) извора стварних података водећа цифра се дистрибуира на специфичан, неуједначен начин. Према овом закону, прва цифра је 1 скоро једна трећина времена, а веће цифре се јављају као водећа цифра са нижом и нижом фреквенцијом, до тачке у којој се 9 као прва цифра појављује мање од једног пута у двадесет. Ова расподјела првих цифара логично се јавља кад год се скуп вриједности дистрибуира логаритамски.

Једна анализа која је искористила ову потезу Боудевијна Роукема са Универзитета Ницолаус Коперник у Пољској закључила је да је за Мехди Карроуби било готово двоструко више пребројавања гласова, него што би се очекивало Бенфордовим законом. Поред тога, Роукема је сумњао да би резултати за Ахмадинеџада, у којима је било мање 1 и више 2 и 3 од очекиваних, били вероватни да би неко одлучио да манипулише резултатима променом тачке 1 на почетку гласања у 2 и 3с. То би такође довело до прецјењивања укупног броја Ахмадинеџада са неколико милиона гласова.

Валтер Мебане, политолог и статистичар са Универзитета у Мичигену, такође је користио Бенфордов закон у својој анализи, у којој такође налази неколико неправилности у иранским изборним резултатима. Али чак и он признаје да су, иако су његови резултати "компатибилни са широм преваром", такође "компатибилни с тим да је Ахмадинеџад заправо победио".

Последње две цифре

Двоје дипломираних студената политолошких наука на Цолумбиа Университи узело је још треће место у подацима. У анализи коју су сажели у општини Васхингтон Пост, они су испитали последње две цифре бројања гласова из 29 покрајина за сваког од четири кандидата (нпр. Ако је неко добио 14.579 гласова, у обзир су узети само 7 и 9 анализа).

Последње две цифре у изборним резултатима су случајни шум, а дистрибуција цифара би требало да буде прилично равномерна - свака цифра треба да се појави око 10 одсто времена. Људи су, међутим, лоши генератори случајних бројева и када правимо бројеве, склони смо да бирамо неке бројеве чешће од других. У иранским резултатима, само 4 процената бројева завршава цифром 5, док се бројка 7 појављује у 17% времена. Резултати који толико одступају могли би се очекивати на око четири од сваких 100 избора.

Људи такође имају проблема са прављењем бројева који немају суседне цифре (тј. Мања је вероватноћа да ћете их наћи 72 него са 23), али би ови бројеви требало да следе и случајне обрасце, а око 70 одсто парова требало би да се састоји од не-суседних цифара. Међутим, у иранским резултатима, само 62 посто то чини. Опет, ови резултати би се могли очекивати на отприлике 4 од сваких 100 избора. Али комбинација ова два резултата би се очекивала на само 1 од сваких 200 избора. Можда је невероватно, али није немогуће.

Где нас то оставља? Никад нећемо знати јесу ли пријављени резултати стварни или не. Мој лични најдражи део података из свега овога не захтева никакве калкулације које би довеле до питања легитимности избора. Овај цитат Аббас-Али Кадкходаеија, портпарола иранског вијећа гардистана, натјерао би скоро свакога да размисли:

Статистике које је дао Мохсен Ресаеи у којима он тврди да је више од 100% оних који испуњавају услове гласало у 170 градова нису тачни - инцидент се догодио у само 50 градова.

(Више о анализама резултата у избору у Ирану потражите у Нате Силвер-у на петтхиртиеигхт.цом)

Кориштење математике за испитивање иранских резултата избора