Dr. Senja Pollak razvija modele strojnega učenja, ki delujejo onkraj posameznega jezika in omogočajo hitrejšo analizo različnih spletnih vsebin.

Odkar se je velik del naše komunikacije preselil v digitalni svet, se zdi, da se razumemo vse slabše. Svetovni splet je postal okolje, kjer cvet sovražni govor, kjer so največ pozornosti deležne izjave in teme, ki kar najbolj pritegnejo našo pozornost, ki nas kar najbolj vznemirijo. Splet človeške psihologije in aktualnih algoritmov.

A internet je danes obenem tudi že temeljna infrastruktura, brez katere ne gre, goram podatkov pa na roke še zdaleč ne moremo biti kos. Potrebna je pomoč orodij umetne inteligence, ki pa morajo biti – to se je tudi že dodobra pokazalo – premišljeno razvita. Danes so ta orodja še najbolj razvita v angleščini, ki pa seveda še zdaleč ni edini jezik, ki ga na spletu uporabljamo. Tu nastopijo t. i. jezikovne preslikave, ki omogočajo, da znanje, ki so ga modeli strojnega učenja že usvojili na enem jeziku, uporabljamo prek vrste različnih jezikov.

Dr. Senja Pollak z Odseka za tehnologije znanja na Inštitutu ʺJožef Stefanʺ trenutno koordinira evropski projekt Embeddia, katerega namen je razvoj jezikovnih tehnologij, ki ravno takšne med-jezikovne prenose omogočajo, s poudarkom na analizi medijskih vsebin.

»Za medijske hiše se je pokazal kot najbolj zanimiv aplikativni problem moderiranje komentarjev,« izpostavlja dr. Senja Pollak. »Zanimivo je bilo slišati, kako depresivna služba je celodnevno branje nezaželenih vsebin. Zato se ukvarjamo s tem, kako bi pomagali moderatorjem, da bi hitreje prišli do teh vsebin.«

Nina Slaček