НЕУРОЗНАНСТВЕНИЦИ СУ ПРЕТВАРАЛИ МОЖДАНЕ ТАЛАСЕ У ВЕРБАЛНИ ГОВОР

Иста технологија која покреће вашег брбљивог мобилног асистента једног дана би могла да пружи глас онима који су изгубили способност говора. Како Ренае Реинтс извештава за Фортуне, неурознанственици са Универзитета Колумбија недавно су направили велико напредовање ка овом футуристичком циљу, успешно преводећи мождане таласе у разумљив говор по први пут.

Истраживање тима, објављено у часопису Сциентифиц Репортс, укључује помало неконвенционалан приступ. Уместо да директно прате мисли како би произвели говор, истраживачи су забележили неуролошке обрасце генериране од стране испитаника који слушају како други говоре. Ови мождани таласи су убачени у воцодер - алгоритам вештачке интелигенције који синтетише говор - и потом претворени у разумљив, иако роботски-сонски, говор који одражава фразе које су учесници чули.

"Наши гласови помажу да нас повежу са нашим пријатељима, породицом и светом око нас, због чега је губитак снаге нечијег гласа услед повреде или болести толико погубно", каже аутор студије Нима Месгарани, инжењер из Цолумбиа неуробиологи програма, Изјава. „Данашњом студијом имамо потенцијални начин да обновимо ту снагу. Показали смо да, с правом технологијом, сваки слушалац може декодирати мисли тих људи. "

Вриједно је напоменути, према Гизмодо -у Георге Дворски, да научници још нису смислили како директно превести унутрашње мисли, познате и као замишљени говор, у речи. У овом идеалном сценарију, појединци који користе говорну технологију једноставно би замислили оно што желе да кажу, а затим би чекали да вештачки говорни систем вербализује ове мисли.

Покојни британски физичар Степхен Хавкинг користио је рудиментарну верзију технологије синтезе говора да би комуницирао са другима. Како Нина Годлевски пише за Невсвеек, Хавкингу је дијагностицирана амиотрофична латерална склероза (АЛС) у 21. години. Болест моторног неурона на крају је захтијевала његове говорне способности, приморавши га да користи ручни кликер да покрене говор.

Кад је Хавкинг изгубио руке, прешао је на систем заснован на покретима лица; Гизмодо Дворски даље објашњава да је научник користио јагодски прекидач повезан са наочарима да би изабрао речи које изговара синтетизатор гласа.

Напредна итерација ове технологије пропустила би средњег човека, омогућавајући корисницима да производе говор без помоћи рачунара или система осетљивог на кретање.

Упоредно, Авери Тхомпсон напомиње за Популар Мецханицс, студија Цолумбиа фокусира се на превођење „слушаног говора.“ Истраживачи су регрутовали пет пацијената са епилепсијом који су били подвргнути операцији на мозгу и замолили их да слушају низ изговорених речи - на пример, снимак некога бројање од нула до девет - док су спојени на уређаје за неуронско праћење.

Мождани таласи заробљени тим алатима убачени су у воцодер, који је синтетизовао говор уз помоћ неуронске мреже, обучене, речима футуризма Кристин Хоусер, да "очисти" излаз и учини звукове разумљивим.

Затим су научници замолили 11 других учесника да слушају говор који подржава АИ. Значајно је да коаутор студије Месгарани у изјави за Цолумбиа истиче да су ти људи могли да "разумеју и понове" звукове отприлике 75 одсто времена - "далеко изнад" брзине примећене у било којим претходним експериментима. (Снимке можете сами просудити овдје.)

У интервјуу с Гвормодовим Дворским, Месгарани каже да се он и његове колеге надају да ће синтетизовати сложеније фразе у блиској будућности. Истраживачи такође желе да забиљеже мождане сигнале које генеришу испитаници који размишљају или замишљају чин говорења, а не да једноставно слушају како други говоре. Коначно, додаје Месгарани у изјави, тим има за циљ да једног дана технологију трансформише у имплантат који може превести мисли корисника директно у речи.

Потенцијална ограничења новог истраживања укључују његову малу величину узорка и, према неурознанственици са свеучилишта у Невцастле-у, Андрев Јацксон, који није био укључен у студију, чињеница да би неуронске мреже требало да уведу велики број можданих сигнала од сваког новог учесника да би се синтетизовао говор преко бројева од нула до девет.

„Биће занимљиво у будућности видети како добро декодери обучени за једну особу уопштавају друге људе“, каже Џексон Гизмоду . „То је помало попут система раног препознавања говора које је корисник морао индивидуално обучити, за разлику од данашњих технологија, попут Сири и Алека, који могу имати смисла за нечији глас, поново користећи неуронске мреже. Само ће време показати да ли би ове технологије могле једног дана учинити исто за сигнале мозга. "