https://frosthead.com

Свет према Твиттеру, у Мапс

Твеетови из цијелог свијета који су цртани по локацији као дио нове студије. Кликните за увећање. Слика преко првог понедељка / Леетару ет. ал.

Тешко је проценити колико је брзо и темељно Твиттер преузео свет. Пре само седам година, 2006. године, то је била идеја нацртана на папиру. Сада услугу користи процењено 554 милиона корисника - број који чини готово 8 процената свих људи на планети - а послато је процењених 170 милијарди твитова, при чему се тај број сваки дан повећава за око 58 милиона .

Сви ови твеетови пружају непроцјењив извор вијести, забаве, разговора и повезаности међу људима. Али за научнике су такође вредни и као нешто поприлично другачији: сирови подаци.

Будући да Твиттер има отворени АПИ (који омогућава да се твеетови преузимају као необрађени, анализирани подаци), а многи твеетови се географски означавају, истраживачи могу да користе милијарде ових твитова и анализирају их по локацији да би сазнали више о географији људи широм планете. Прошле јесени, у склопу Глобал Твиттер Хеартбеат-а, тим Универзитета у Иллиноису анализирао је језик и локацију преко милијарду твитова из свих америчких држава како би створио софистициране мапе ствари попут позитивних и негативних емоција изражених током урагана Санди, или подршку Барацку Обама или Митт Ромнеи током председничких избора.

Као што је Јосхуа Кеатинг напоменуо на блогу Вањске политике вањске политике, чланови исте групе, на челу с Калевом Леетаруом, недавно су отишли ​​корак даље. Као што је објављено у новој студији почетком ове недеље у интернет часопису Први понедељак, они су анализирали локације и језике 46.672.798 твитова објављених између 23. октобра и 30. новембра прошле године како би се створио запањујући портрет људских активности широм планете, приказан на врх поста. Искористили су Твиттер децахосе, ток података који у било којем тренутку биљежи случајних 10 посто свих твеета широм свијета (што је за временски период износило 1.535.929.521) и једноставно су се фокусирали на твеетове са припадајућим географским подацима.

Као што истраживачи напомињу, географска густина твитераша у многим регионима - посебно у западном свету, где се рачунари, мобилни уређаји и Твиттер користе на највишим нивоима - у потпуности одговара стопама електрификације и употребе расвете. Као резултат, мапе твитераша (попут детаљног приказа континенталног дела САД-а доле) ноћу увелико личе на сателитске снимке вештачке светлости.

Кликните за увећање. Слика преко првог понедељка / Леетару ет. ал.

Као тест да видимо како се твеетови подударају са употребом вештачке светлости, направили су композитну мапу испод које су твеетови приказани као црвене тачкице, а ноћно осветљење је приказано плаво. Области у којима се подударају у учесталости (и ефективно се поништавају) приказани су као бијели, а подручја гдје један надмашује други остају црвени или плави. Многа подручја изгледају прилично бијело, с неким кључним изузецима: Иран и Кина, гдје је Твиттер забрањен, примјетно су плави, док се у многим земљама с релативно ниским стопама електрификације (али у којима је Твиттер још увијек популаран) појављују црвене боје.

Кликните за увећање. Слика преко првог понедељка / Леетару ет. ал.

Пројекат је постао још занимљивији када су истраживачи користили аутоматизовани систем да би разврстали твитере по језику. Најчешћи језик на Твиттеру је енглески, који је заступљен у 38, 25 посто свих твитераша. Након тога су дошли Јапанци (11, 84 процента), Шпанци (11, 37 процената), Индонежанке (8, 84 процента), Норвежанке (7, 74 процента) и Португалци (5, 58 процената).

Тим је саставио мапу свих твитова написаних на 26 најпопуларнијих језика, а сваки је представљен другачијом бојом, испод:

Кликните за увећање. Слика преко првог понедељка / Леетару ет. ал.

Иако твеетови већине земаља доминирају на њиховим званичним језицима, откривено је да многи твитове укључују на разним другим језицима. Погледајте довољно пажљиво и видјет ћете дугу боју која суптилно искаче из сивих тачака (енглески твеетови) који покривају САД:

Кликните за увећање. Слика преко првог понедељка / Леетару ет. ал.

Између осталих анализа, истраживачки тим је чак размотрио географију ретитизовања и референцирања - просечну удаљеност између корисника и некога ко је ретвеетс, као и просечну удаљеност између тог корисника и некога кога он или она једноставно наводи у твиту. Просечна удаљеност за ретвеет је била 1, 115 миља и 1, 118 за референцу. Али, контраинтуитивно, постојао је позитиван однос између броја пута када је неки корисник поновио повратак или упућивао другог корисника и њихове удаљености: Парови корисника са само прегршт интеракција, у целини, вероватније су били ближе (500- Удаљеност 600 миља) од оних са десетинама ретвеета и референцама између њих.

Ово указује да корисници који живе далеко један од других имају већу вероватноћу да ће Твиттер редовно комуницирати. Једно од објашњења може бити да су ентитети са највише сљедбеника - а тиме и највише референце и ретвеета - често познате личности, организације или корпорације, корисници које људи познају, али у ствари немају лични однос. Глобална карта ретвеетс између корисника је испод:

Кликните за увећање. Слика преко првог понедељка / Леетару ет. ал.

У раду је прошао још детаљније о другим подацима повезаним са твитовима: однос између праћења вести и броја твитераша у некој земљи (Европа и САД добијају несразмерну покривеност у медијима, док су Латинска Америка и Индонезија превидјене), места која Твиттер има додали су највише корисника у последње време (Блиски Исток и Шпанија) и места на којима корисници у просеку имају највише следбеника (Јужна Америка и Западна обала).

Постоји неколико упозорења на све ове податке. За један, иако је број твеета анализиран на десетине милиона, још увијек је само 0, 3 посто свих посланих твеетова, па можда неће адекватно заступати све Твиттер обрасце, посебно ако се корисници који омогућују географско означавање понашају другачије од осталих. Поред тога, у свету који се брзо мења на Твиттеру, неки трендови су се можда већ значајно променили од прошле јесени. Али како Твиттер наставља да расте и што више података постаје доступно, разлог је да ће ова врста анализа постати популарнија само за демографе, рачунарске научнике и друге истраживаче.

Свет према Твиттеру, у Мапс