Umetna inteligenca posluša glas in ustvari podobo vašega obraza

Zagotovo ste kdaj ob poslušanju lepega glasu po radiu pomislili, kakšen je videz govorca ali govorke. Včasih imamo na podlagi glasu precej jasno izdelano predstavo o nekom, ki ga še nikoli nismo videli, a se izkaže, da je v resnici videti povsem drugačen.
Skupina znanstvenikov, ki je sodelovala z Laboratorijem za računalniško znanost in umetno inteligenco na ameriškem MIT-u, se je lotila odgovoriti na vprašanje, ali je mogoče na podlagi kratkega posnetka govora rekonstruirati človekov obraz? Globoko nevronsko mrežo so pripravili do tega, da pregleduje in posluša milijone videoposnetkov govora na Youtubu in svetovnem spletu. Orodje Speech2Face tako postaja vedno bolj vešče prepoznavanja korelacij med govorom in podobo obraza. Zgolj s poslušanjem glasu lahko ustvarja verodostojne podobe govorcev, njihove narodnosti, spola in starosti.

Predstojnik Laboratorija za strojno inteligenco na ljubljanski Fakulteti za elektrotehniko in izredni profesor dr. Simon Dobrišek pojasnjuje, da gre za poskuse razvoja računalniških globokih nevronskih modelov, ki izberejo oziroma oblikujejo obraz, ustrezen glasu, možno pa je seveda tudi obratno.

Blaž Mazi