Прошле године, група немачких рачунарских научника направила је таласе демонстрирајући нови рачунарски алгоритам који би могао претворити било коју дигиталну фотографију у уметничко дело опонашајући сликарске стилове мајстора као што су Винцент ван Гогх, Пабло Пицассо и Едвард Мунцх. Иако импресиван подвиг, примјена исте технике на покретним сликама тада је дјеловала невјеројатно. Али сада, друга група истраживача је то схватила, брзо и неприметно производећи покретна дигитална ремек дела, пише Царл Енгелкинг за Дисцовер .
Сличан садржај
- Овај анимирани филм о Ван Гогх-у направљен је потпуно од нафтних слика
- Ова умјетна неуронска мрежа ствара апсурдне линије преузимања
У видео демонстрацији, програмери показују уметничке способности алгоритма трансформишући сцене из филмова и телевизијских емисија попут Леденог доба и Мисс Марпле у анимацију сличну сликању са кликом миша. Али развој алгоритма није био мали подвиг.
Да би створио тако детаљну трансформацију, рачунарски научник Леон Гатис и његови колеге са Универзитета у Тубингену развили су алгоритам дубоког учења који покреће вештачку неуронску мрежу. Опонашајући начине на које неурони у људском мозгу успостављају везу, ови систем машинског учења могу обављати много сложеније задатке од било којег старог лаптопа.
Ево како то функционише: када гледате слику слике или гледате филм на лаптопу, сведочите да рачунар декодира информације у датотеци и презентује их на одговарајући начин. Али када се те слике обрађују преко неуронске мреже, рачунар може да узме више различитих слојева информација који се налазе у тим датотекама и одабере их појединачно.
На пример, један слој може садржавати информације о основним бојама у Ван Гогховој Звезданој ноћи, док следећи додаје мало више детаља и текстуре, и тако даље, према МИТ Тецхнологи Ревиев . Систем тада може мењати сваки различити слој појединачно, пре него што их поново постави заједно да би створио потпуно нову слику.
"Можемо да манипулирамо са обе репрезентације независно да бисмо произвели нове, перцептивно смислене слике.", Написао је Гатис у студији објављеној на арматурском серверу препресса.
Применом овог система слојевитог учења на сликама Пицасса и ван Гогха, да напоменем неколико, истраживачи су успели да развију алгоритам који је „научио“ рачунар да све те информације протумачи на начин који раздваја садржај слика из свог стила. Једном када је схватио како ван Гогх користи кист и боју, онда је могао да примијени тај стил попут Пхотосхоп филтра на слику и ефективно га рекреира у свом иконичном стилу, Матт МцФарланд је написао за Васхингтон Пост . Али примјена ове технике на видео представљала је потпуно нови сет проблема.
"У прошлости је ручно цртање слике у одређеном уметничком стилу захтевало професионалног уметника и дуго времена", пишу Мануел Рудер и његов тим са Универзитета у Фреибургу у својој новој студији, такође објављеној на арКсив-у. "То радити за видео секвенцу једном руком било је ван маште."
Када су Рудер и његове колеге први пут покушали да примењују алгоритам на видео снимке, рачунар је избио кукчић. На крају су схватили да програм третира сваки кадар видео записа као засебну фотографију, због чега видео погрешно трепери. Да би решили овај проблем, истраживачи су ставили ограничења на алгоритам који је спречавао рачунар да превише одступа између оквира, пише Енгелкинг. То је омогућило програму да се смири и примени доследан стил на цео видео.
Алгоритам није савршен и често има проблема при управљању већим и бржим кретањем. Међутим, то и даље представља важан корак напријед у начинима на који рачунари могу да приказују и мијењају видео записе. Иако је у раној фази, будући алгоритми ће можда моћи да примене овај ефекат на видео снимке снимљене кроз апликацију за паметне телефоне или чак да направе верзије верзије ваше омиљене слике, наводи МИТ Тецхнологи Ревиев .
Идеја о спуштању уметниковог стила на скупа података може покренути неке људе, она такође отвара врата за све нове врсте уметности за које се никада раније није веровало да су могуће.