Razpisane teme za diplomske naloge (1. stopnja UNI, VSŠ)

LGM - Laboratorij za računalniško grafiko in multimedije

V kolikor vas kaka izmed tem zanima, kontaktirajte predstojnika laboratorija izr. prof. dr. Matijo Marolta ali viš. pred. Alenko Kavčič. Posivene teme niso več na voljo (so že izbrane).

Multimediji

Obdelava videa v realnem času z GPE in platformo Nvidia Shield

Z namenskimi “pametnimi” algoritmi za izboljšanje kontrasta in ostrine slik lahko močno izboljšamo jasnost video vsebin za slabše-videče ali starejše uporabnike. Namen diplomske naloge je izdelava prototipne aplikacije za platformo Nvidia Shield (Android OS), ki bo z implementacijo tovrstnih algoritmov na GPE v realnem času obdelala vhodni video tok in pri tem omogočala spreminjanje parametrov teh algoritmov. Tehnologije: Android, OpenCV, GStreamer, NVidia Shield.

Vizualizacija zvoka in besedil na spletu 

Naloga zajema izdelavo spletnega orodja, ki na intuitiven način uporabniku prikaže zvočni posnetek (npr. govor ali petje) in pripadajoče na nivoju besed poravnano besedilo. Ob predvajanju posnetka orodje prikazuje trenutni položaj v besedilu, s klikanjem po besedilu pa omogoča premikanje po zvočnem posnetku. Prav tako naj nudi možnost popravljanja poravnave besed s posnetkom v primeru napak pri poravnavi. Tehnologije: odjemalec-JavaScript, strežnik: node.js ali podobno.

Prikaz besedila ob predvajanju zvočnega posnetka (za program BVS-RI)

Aplikacija Interaktivna karta slovenskih narečnih besedil omogoča poslušanje zvočnega posnetka skupaj s prikazom njegove transkripcije in poknjiženim besedilom. Za nekatere posnetke imamo tudi podatke o poravnavi transkripcije in zvočnega posnetka na nivoju besed (za posamezno besedo sta označena začetni in končni čas v zvočnem posnetku). V okviru diplomske naloge bi aplikacijo nadgradili tako, da bi ob predvajanju zvočnega posnetka prikazovala položaj v besedilu (obarvala trenutno slišano besedo - podobno kot pri karaoke). Poleg tega naj aplikacija omogoča tudi izbiro besedila, ki ga nato slišimo, in obratno, izbiro mesta v zvočnem posnetku, za katerega prikaže ustrezno besedilo. Izbira besedila naj deluje na nivoju besed ali na nivoju stavkov (odvisno tudi od podatkov, ki jih imamo o poravnavi). Naloga obsega tudi pripravo poravnave (vsaj na nivoju stavkov) za nekaj dodatnih zvočnih posnetkov in na podlagi teh pripravljenih poravnav ovrednotenje delovanja aplikacije. Tehnologije: PHP, AngularJS, JavaScript.

Spletno orodje za poravnavo posnetkov in besedila (za program BVS-RI)

Cilj diplomske naloge je izdelati spletno orodje, ki omogoča poravnavanje besedila z zvočnim posnetkom. V ta namen bi najprej pripravili izčrpen pregled orodij, ki so trenutno na voljo za poravnavo in anotacijo, ter njihovo oceno na podlagi več kriterijev (npr. enostavnost uporabe, kompatibilnost, podprte funkcionalnosti, podprti formati in podobno). Rezultati pregleda bi bili vodilo tudi za načrtovanje vašega orodja, ki bi moralo podpirati anotacijo na več nivojih (stavki, besede, lahko pa tudi posamezni glasovi ali pa skupina besed), popravljanje besedila, vpisovanje besedila - če to ni vnaprej pripravljeno in podobno (kot primer lahko pogledate orodje Praat, ki pa je seveda veliko bolj obsežno). Izdelano orodje bi moralo biti enostavno in intuitivno za uporabo. Nalogo zaključite z evalvacijo orodja (izvedba poravnave za nekaj zvočnih posnetkov in oceno delovanja orodja).

Računalniška grafika in vizualizacija

Proceduralno generiranje letalskih posnetkov pokrajine z GAN-i

Cilj diplomske naloge je izdelava globokega modela GAN (angl. Generative Adversarial Network) za generiranje letalskih posnetkov pokrajine. Učna baza so geodetski podatki Slovenija (letalski posnetki, zemljevidi in LiDAR podatki), ki so javno dostopni in so na voljo v obliki slik različnih resolucij. Cilj takšnega modela je generiranje novih kosov pokrajine, ki so čimbolj realistični. Kot nadgradnja je možna nadgraditev modela, ki bo generiral tudi višinsko informacijo površja.

Reprojekcija LiDAR podatkov iz letalske v prizemljeno domeno

LiDAR podatki o površju so oblaki točk, zajeti z laserskim senzorjem iz letala in predstavljajo površje in objekte na površju. Takšni podatki so bili zajeti za območje celotne Slovenije in se uporabljajo v različne namene (npr. za določitev reliefa, identifikacijo rabe tal, štetje dreves v gozdovih ipd.). LiDAR tehnologija pa je v zadnjem času še močno prisotna pri zasnovi avtonomnih vozil. Ideja naloge je zasnovati dva simulatorja LiDAR senzorja (letalski in zemeljski) omogočiti zajem terena z enim in drugim senzorjem in razviti postopek za avtomatsko pretvorbo (reprojekcijo) podatkov zajetih z letalskim senzorjem v obliko kot jo zajame prizemljen senzor. Razvito metodo reprojekcije želimo ovredonotiti na podatkih ustvarjenih z razvitima simulatorjema nato pa jo uporabiti na realnih podatkih Slovenije.

Vizualizacija tekočinskih okolij

V okviru diplomskefa dela je predviden razvoj posplošenega modela tekočinskih okolij za namene uporabljanja. Razviti želimo tako tekočniski model temelječ na postprodukcijskih senčilnikih za nemene uporabe v klasičnem grafičnem cevovodu kot proceduralni volumetrični model, ki bo uporaben pri volumetričnem upodabljanju. Razvit tekočinski model želimo, da je precej splošen in omogoča prilagoditev gostote/viskoznosti medija kot tudi prosojnosti/presevnosti, hkrati pa želimo simulirati tudi lokalne pertubacije v mediju.

Volumetrični podatki

Abstrakcija oblik celičnih struktur z globokim učenjem

Celica predstavlja osnovni gradnik živih bitij in organizmov, njena struktura pa je raziskana le v grobem. K boljšemu in bolj celovitemu razumevanju njenega delovanja lahko pripomore informacija o strukturi, obliki, lokaciji in interakciji celičnih podstruktur. V sodelovanju z Inštitutom za biologijo celice se v laboratoriju ukvarjamo s segmentacijo volumetričnih podatkov celic mehurja. S postopkom segmentacije podatke razdelimo v posamezne celične dele oz. strukture, kar lahko uporabimo tudi pri kasnejši rekonstrukciji zgradbe celice. Za segmentacijo uporabljamo metode globokega učenja. V tej nalogi bi študent implementiral rešitev, ki bi za naše segmentacije vrnila abstrakcijo oblik. Na podlagi dobljenih abstrakcij in novih informacij o obliki, bi študent naredil kvantitativno analizo celičnih struktur. Diplomsko delo bi temeljilo na ideji in kodi članka Learning Shape Abstractions by Assembling Volumetric Primitives (https://github.com/shubhtuls/volumetricPrimitives).

Grafični gradniki za interaktivno raziskovanje volumetričnih podatkov

Pri upodabljanju volumetričnih podakov moramo lokacijam v prostoru pripisati različne optične lastnosti, npr. gostoto, barvo, emisivnost, parametre sipanja ipd. To preslikavo opravlja t. i. prenosna funkcija, z njenim prilagajanjem pa lahko upodabljamo različne medije, npr. oblake, meglo, ogenj, trdne snovi ipd. Poleg tega se optične lastnosti medijev običajno spreminjajo glede na vrednost volumetričnih podatkov ali njihovega gradienta. Prilagajanje prenosne funkcije je dokaj težaven in uporabniku neprijazen postopek. Cilj naloge je zasnovati grafične gradnike za učinkovito upravljanje z optičnimi lastnostmi volumetričnih podatkov. Izdelani naj bi bili s spletnimi tehnologijami, poudarek pa je na interaktivni uporabi. Študent naj bi implementirane pristope medsebojno primerjal in ovrednotil.