https://frosthead.com

Софтвер ствара једну слику која каже све

Свакодневно, корисници постављају више од 350 милиона фотографија на Фацебоок. Овакав прилив слика довео је до аналитичара да су проценили да је у последњој години направљено 10 одсто светских 3, 5 билиона фотографија. Сви ти подаци који преплављују Интернет значи да ако тражите одређену слику или објект - како изгледа, на пример, наранџаста мачка таблица - позитивно сте преплављени резултатима претраге.

Прошлог месеца су истраживачи са Калифорнијског Беркелеија представили нови софтвер, АверагеЕкплорер, који ће корисницима омогућити да виде „просечну“ слику која представља оно што траже. Уместо да слика вреди хиљаду речи, она је слика вредна хиљаду или више слика.

„Када уђете у Гоогле претрагу слика, просијаћете странице и странице слика“, објашњава Јун-Иан Зху, студент УЦ Беркелеи и главни аутор рада, представљеног на овогодишњој Међународној конференцији и изложби рачунарске графике. и Интерактивне технике у Ванцоуверу. „Огромно је и тешко сажети; не можете да схватите шта се дешава. "

За своју почетну понуду, Зху и његов тим прикупили су фотографије путем Флицкр, Гоогле и Бинг претрага слика. Софтвер је довољно мале снаге да би се покренуо на просечној радној површини и може истовремено уситнити око 10 000 слика.

Корисници прецизирају своје претраге на неколико различитих начина. Они могу да скицирају и обоје облик, слично као на цртежу у Адобе Пхотосхопу или Иллустратору, да би изоштрили резултат просечне слике. На пример, бојање позадине просечне слике Еиффеловог торња само ће одабрати просечну слику да бисте повукли само фотографије снимљене ноћу. Или можете нацртати нагнуте линије да бисте контролисали оријентацију лептира у композиту.

Мост уздаха, из дана у ноћ Пречишћавањем боја на слици АверагеЕкплорер Бридге оф Сигхс, можете да мењате сцену из дана у сумрак до ноћи. (Љубазно УЦ Беркелеи)

Једном када се створи просечна слика, процес који може потрајати и минут, корисници могу додатно прецизирати резултат користећи оно што тим назива Екплорер Моде. У овом режиму, кликом на одређени део слике - рецимо, мачји нос - откриће се друге уобичајене опције или прецизирања за то место - можда плави или црни носеви, или они који су заобљени уместо угаоних. На пример, у демо видеу, тим је рафинирао слику деце у Деда Мразу одабиром само слике где Деда Мраз има једно дете на свакој руци.

Зху ће систем постати посебно моћан, каже Зху, као средство за тренирање алгоритама рачунарског вида, попут оних који се користе у Гоогле Гогглес или Амазон Фирефли апликацијама, који могу препознати на шта камера указује. „На пољу рачунарског вида, људи троше пуно новца на напомену о објектима“, објашњава он. „Сада можете примијенити напомену на просјечну слику. Идеја је да требате радити само на једној слици да бисте пропагирали све слике у скупу података. "

Проналажење пасмина мачака Пречишћавањем начина претраживања, истраживачи могу да пронађу одређене пасмине мачака, укључујући (с лева на десно) Рагдола, Сијамске, Маине Цоон и Сфинге. (Љубазно УЦ Беркелеи)

Стварање уметничких дела је плод са ниским висиком за АверагеЕкплорер. Тим је црпео инспирацију од уметника нових медија попут Јасон Салавона, који је марљиво стварао просечне фотографије руком. Такође би се могао користити за креирање Фацебоок додатка који омогућава корисницима да се позабаве просечном сликом о себи.

Аспирације истраживача су још шире и утицајније. Социолози би могли да користе систем за откривање и истраживање друштвених трендова; на пример, просечна слика може доказати да младенке најчешће стоје десно од младожење у венчаним портретима. АверагеЕкплорер би такође могао бити користан алат за медијске аналитичаре који покушавају да сецирају телевизијску покривеност - да ли се став Степхена Цолберта мења када говори о Георгеу В. Бусху у односу на Барацк Обама?

Омогућујући корисницима да интуитивно комуницирају са визуелним подацима, уместо да се труде да уђу у исправан низ кључних речи, корисници ће моћи да премосте оно што Зху саветник и сукреатор АверагеЕкплорер, Алексеј Ефрос, назива „уским грлом језика“.

Тим замисли скуп прилагођених алата дизајнираних за специфичне, тешко артикулирајуће задатке. Апликација за куповину, на пример, омогућила би кориснику да пајкује мрежицу ​​за пар пете тачном бојом, обликом пете и висином коју прати. Зху предвиђа алат који се интегрише с радом полицијских скица умјетника, омогућавајући свједоку да претражује базе података лица на карактеристикама које се поклапају с починитељем и конструира сложени портрет.

Основна верзија АверагеЕкплорера биће објављена ове јесени.

Софтвер ствара једну слику која каже све