Published using Google Docs
Razpisane teme za magistrske naloge - LGM
Updated automatically every 5 minutes

Razpisane teme za magistrske naloge (2. stopnja)

LGM - Laboratorij za računalniško grafiko in multimedije

V kolikor vas katera izmed tem zanima, kontaktirajte predstojnika laboratorija prof. dr. Matijo Marolta, doc. dr. Matevža Peska ali doc. dr. Cirila Bohaka. Posivene teme niso več na voljo (so že izbrane).

Multimediji

Segmentacija in tematska razpoznava člankov

Kontakt: prof. dr. Matija Marolt

Pri digitalizaciji arhivov časopisov in revij je večkrat zaradi kompleksne postavitve elementov na straneh težko ugotoviti katere vsebine in slike sodijo v posamezne članke. V nalogi se boste posvetili področju analize dokumentov s ciljem povezovanja sorodnih elementov v enotne članke in razvrščanju člankov v kategorije (npr. recenzija, intervju, poročilo s koncerta  …). Pri tem boste preučili obstoječe pristope in izdelali svoj model za analizo ter ga preizkusili na novi digitalizirani zbirki.

Literatura:

  1. Galal M. Binmakhashen and Sabri A. Mahmoud. 2019. Document Layout Analysis: A Comprehensive Survey. ACM Comput. Surv. 52, 6, Article 109 (November 2020), 36 pages. https://doi.org/10.1145/3355610
  2. https://github.com/Layout-Parser/layout-parser 

Sistem za avtomatsko sledenje izvajalca glasbe

Kontakt: prof. dr. Matija Marolt

Sistemi za avtomatsko sledenje (score following) v realnem času sledijo tempu izvajalca glasbe, pri čemer si pomagajo s poznavanjem notnega zapisa izvedene skladbe. V nalogi boste preučili trenutno stanje na tem področju in implementirali svoj odprtokodni sistem za sledenje.

Literatura:

  1. A. Arzt,  Flexible and robust music tracking
  2. Lee, Musical Score Following and Audio Alignment

Razvoj novih didaktičnih prijemov za trening glasbene teorije z zajemom zvoka za platformo Trubadur

Kontakt: doc. dr. Matevž Pesek

Cilj magistrske naloge je razvoj novih poigrenih učnih procesov in iger za učenje glasbene teorije in trening posluha z zajemom zvoka iz mobilne naprave, interakcijo z napravo (tapping) ali konvencionalnimi vnosi na platformi Trubadur [1,2,3]. Predlagane igre predstavljajo nadgradnjo obstoječih zmožnosti platforme Trubadur (https://trubadur.si, [4,5]]). Trenutni stack je Laravel (admin, backend) + Flutter (web in mobile frontend) v trenutni razvojni verziji 2.1.
Projekt razvijamo v sodelovanju s Konzervatorijem za glasbo in balet, Ljubljana in nižjimi glasbenimi šolami, kjer platformo uporabljajo pri pouku glasbene teorije. Pri razvoju aplikacije boste uporabili agilne pristope evalvacije uporabniškega vmesnika in izvedli A/B testiranje s študenti. Pripravljamo tudi longitudinalno študijo uporabe platforme, kjer je predvideno večmesečno testiranje. Predviden znanstveni prispevek je vsaj 1 SCI članek.

Literatura:

  1. M. Pesek, Z. Vucko, P. Savli, A. Kavcic, M. Marolt, “Troubadour: A gamified e-learning platform for ear training,” IEEE Access, vol. 8.pp. 97 090–97 102, 2020. https://ieeexplore.ieee.org/document/9093057/ 
  2. M. Pesek, L. Suhadolnik, P. Šavli, and M. Marolt,“Motivating students for ear-training with a rhythmic dictation application,” Applied Sciences (Switzerland), vol. 10, 2020. https://www.mdpi.com/2076-3417/10/19/6781 
  3. M. Pesek, F. Klavž, P. Šavli, and M. Marolt, “Online and in-class evaluation of a music theory e-learning platform,” Applied Sciences (Switzerland), vol. 12, 2022. https://www.mdpi.com/2076-3417/12/14/729672 
  4. https://play.google.com/store/apps/details?id=si.trubadur.v2
  5. https://apps.apple.com/si/app/trubadur-si/id6449623053

Izboljšave kompozicionalnega hierarhičnega modela za odkrivanje vzorcev v glasbi

Kontakt: doc. dr. Matevž Pesek

V laboratoriju smo razvili kompozicionalni hierarhični model za pridobivanje informacij iz glasbe. Model odlikujejo generativnost in zmožnost nenadzorovanega učenja značilk. V model so vgrajeni biološko navdahnjeni mehanizmi, ki želijo obdelavo zvoka približati človekovi slušni zaznavi. Model ima sposobnost učenja različnih enitet (dogodkov) v signalu, zato je primeren za več opravil na področju pridobivanju informacij iz glasbe. Model je bil uspešno apliciran na različne tipe zvoka (spekter, simbolni zapisi, ritem). V magistrski nalogi boste nadgradili obstoječ SymCHM model za simbolne zapise s funkcionalnostjo upoštevanja metrične pozicije in dolžine not pri odkrivanju vzorcev. Model boste tudi ustrezno prilagodili za nove metrike, ki upoštevajo več različnih tipov iskanj vzorcev in primerjali rezultate na novi zbirki, ki jo razvijamo v laboratoriju.

Literatura:

  1. D. Tomašević, S. Wells, I. Y. Ren, A. Volk, and M. Pesek, "Exploring annotations for musical pattern discovery gathered with digital annotation tools," Journal of mathematics and music, vol. 15, iss. 2, pp. 194-207, 2021. http://lgm.fri.uni-lj.si/wp-content/uploads/2022/09/71378691.pdf 
  2. M. Pesek, A. Leonardis, and M. Marolt, “An analysis of rhythmic patterns with unsupervised learning,” Applied sciences, vol. 10, iss. 1, pp. 1-22, 2020. Available: https://www.mdpi.com/2076-3417/10/1/178 
  3. M. Pesek, A. Leonardis, and M. Marolt, “SymCHM – an unsupervised approach for pattern discovery in symbolic music with a compositional hierarchical model,” Applied sciences, vol. 7, iss. 11, pp. 1-21, 2017. Available: www.mdpi.com/2076-3417/7/11/1135 

Navidezna resničnost (VR)

Razvoj izobraževalnih iger v navidezno resničnostnem okolju

Kontakt: doc. dr. Matevž Pesek

Cilj naloge je razvoj izobraževalne igre, ki izpopolnjuje igralčeve umske ali motorične sposobnosti. Na podobnih tematikah v Laboratoriju že delamo (npr. Steady the drums! [1]), namen pa je razviti nove prijeme, predvidoma na področju učenja glasbe, socializacije in pomoči uporabniku [2]. Trenutno razvijamo prototipe na  področjih izobraževanja (osnovno in srednješolsko) na področju glasbe, jezika in naravoslovno-tehničnih tematik.

Literatura:

  1. https://www.oculus.com/experiences/quest/5470851372933076/
  2. N.Hirci, M. Marolt, Z. Lesar, M. Pesek - Evaluating Virtual Reality as Immersive Medium for Enhancing Music Skills  (SalentoXR) https://www.springerprofessional.de/evaluating-virtual-reality-as-immersive-medium-for-enhancing-mus/26004502 

Uporaba "deep fake" nevronskih mrež in orodja MetaHuman za pristne pogovore v navidezni resničnosti

Kontakt: doc. dr. Matevž Pesek

V Laboratoriju razvijamo orodje za navideznoresničnostno komunikacijo z uporabniki z namenom treninga uporabnika v specifičnih situacijah. V VR okolju, ki ga boste razvili, bomo uporabili Metahuman za simulacijo izgleda ostalih uporabnikov, s katerimi bo uporabnik interaktiral. Ostali uporabniki bodo svoje geste in izgled simulirali na način, da bodo izrazno mimiko prenašali na simuliranega avatarja, ki bo čim bolj resničnostno odseval željeni lik v realni situaciji. Dodali bomo instrumentacijo z uporabo livelink-a in post-procesiranje z deep fake nevronskimi mrežami za pristnejši izgled. Izdelan projekt bomo evalvirali v realnem okolju z drugimi agencijami.

Literatura:

  1. https://github.com/iperov/DeepFaceLive 

Razvoj navidezno resničnostnih aplikacij za domačo vadbo, namenjenih uporabnikom s specifičnimi boleznimi in primanjkljaji

Kontakt: doc. dr. Matevž Pesek

Cilj naloge je razvoj navidezno resničnostne aplikacije, ki pomaga in analizira samostojno vadbo uporabnika in analizirane podatke v ločenem (spletnem) umesniku prikazuje ekspertu.

Na podobnih tematikah v Laboratoriju že delamo (npr. Steady the drums! [1]), namen pa je razviti nove prijeme, predvidoma na področju nevroloških bolezni [2] (Parkinson, Alzheimer in podobni), ki bi uporabniku na dostopen način omogočili kontrolirano vadbo, ekspertu pa vpogled v napredek uporabnika. Temo razpisujemo v sodelovanju s strokovnjaki s področja nevrologije.

Literatura:

  1. https://www.oculus.com/experiences/quest/5470851372933076/ 
  2. N.Hirci, M. Marolt, Z. Lesar, M. Pesek - Evaluating Virtual Reality as Immersive Medium for Enhancing Music Skills  (SalentoXR) https://www.springerprofessional.de/evaluating-virtual-reality-as-immersive-medium-for-enhancing-mus/26004502 

Računalniška grafika in vizualizacija

Simulator za vizualizacijo podatkov projekta Znanost na sferi (SoS)

Kontakt: doc. dr. Ciril Bohak

Projekt Znanost na sferi (Science on a Sphere) je namenjen popularizaciji različnih geolociranih podatkov, ki prikazujejo izbrano tematiko na področju celotne zemlje. Naj si gre za prikaz različnih statističnih podatkov ali vnaprej pripravljenih “zgodb” o dogajanju na našem planetu iz najrazličnejših vidikov. Medtem ko so podatkovne zbirke na voljo vsem, je sistem za njihov prikaz plačljiv. Ideja naloge je, da se razvije spletni vmesnik za prikaz vsebin pripravljenih v okviru projekta in se takšne podatke vizualizira na spletu. Predvidena je uporab spletnega igralnega pogona Babylon.js, lahko pa se celoten vmesnik razvije tudi z uporabo nižjenivojskega vmesnika RenderCore. V obeh primerih je predvidena uporaba tehnologije WebGPU, saj omogoča dosti boljši izkoristek virov, kot tudi implementacijo lastnih računskih senčilnikov.

Tema je primerna tudi za magisterij, kjer pa je predvideno, da se poleg obstoječega izdela še sistem za pogovorno interakcijo s sfero z LLM (npr. s ChatGPT ali ekvivalentnim sistemom), kjer se lahko uporabnik pogovarja s sfero in definira kaj naj se na njej prikaže, kaj poveča, …

Literatura:

  1. Domača stran projekta Znanost na sferi: https://sos.noaa.gov
  2. Babylon.js: https://www.babylonjs.com
  3. RenderCore: https://github.com/UL-FRI-LGM/RenderCore

Razširitev upodabljanja z difuzijo s podporo spektralni predstavitvi svetlobe, polarizaciji, fluorescenci in fosforescenci

Kontakt: doc. dr. Ciril Bohak

Globalno osvetlitev v scenah je mogoče realizirati z uporabo različnih pristopov. Najbolj znan je pristop sledenja potem, katerega poglavitna slabost je njegovo počasno delovanje in konvergenca. Vse bolj se za interaktivno in realno-časovno uporabo uveljavljajo alternativni pristopi kot je difuzija. Slednji je do dobra predstavljen v [1]. Predpomnjenje osvetlitve pri volumetričnem upodabljanju z difuzijo.

Literatura:

  1. Šmajdek, Uroš, “Predpomnjenje osvetlitve pri volumetričnem upodabljanju z difuzijo”, magistrsko delo, UL FRI, 2023
  2. Šmajdek, Uroš, “Globalno osvetljevanje volumetričnih podatkov s hibridno difuzijsko metodo”, diplomsko delo, UL FRI, 2020
  3. Šmajdek, Uroš, Žiga Lesar, Ciril Bohak, and Matija Marolt. "Hibridna difuzijska metoda za globalno osvetlitev volumetričnih podatkov." Uporabna informatika 29, no. 4 (2021).

Pretvorba 3D mrežne geometrije v modele sestavljene iz elementov LEGO technic

Kontakt: doc. dr. Ciril Bohak

Izdelava novih kompletov LEGO kock poteka praviloma ročno v modelirnih programih, ki ponujajo osnovne gradnike kock LEGO, ali pa v resničnem okolju iz pravih elementov LEGO. Pri tem se posamezniki velikokrat zelo trudijo najti čimbolj optimalno obliko modelov, hkrati pa poskrbeti tudi za njihovo ustrezno trdnost. Cilj naloge je izdelati enega ali več algoritmov za pretvorbo izbranih tipov mrežnih modelov v modele sestavljene iz kock LEGO (npr. za letala, za avtomobile, …). Pri tem se lahko opirate na obstoječe rešitve navedene med viri (ali širše), ideja pa je razviti tudi kakšno lastno rešitev, ki izboljša obstoječe pristope. V okviru naloge je predviden tudi razvoj primerjalne metodologije, ki objektivno primerja rezultate različnih rešitev na podlagi primerjave zasedanja prostora (s primerjanjem vokseliziranih predstavitev), na podlagi podobnosti s primerjanjem slik modelov zajetih poda različnimi koti, na podlagi trdnosti zgrajenih modelov, na podlagi števila uporabljenih elementov, …

Literatura:

  1. Ono, Sumiaki, Alexis André, Youngha Chang, and Masayuki Nakajima. "LEGO builder: automatic generation of LEGO assembly manual from 3D polygon model." ITE Transactions on Media Technology and Applications 1, no. 4 (2013): 354-360.
  2. Zhou, Jie, Xuejin Chen, and Y. Xu. "Automatic generation of vivid LEGO architectural sculptures." In Computer Graphics Forum, vol. 38, no. 6, pp. 31-42. 2019. (link)
  3. Testuz, Romain Pierre, Yuliy Schwartzburg, and Mark Pauly. Automatic generation of constructable brick sculptures. No. CONF. 2013. (link)
  4. Kim, Jae Woo, Kyung Kyu Kang, and Ji Hyoung Lee. "Survey on automated LEGO assembly construction." (2014). (link)
  5. Tattersall, George, Dizhong Zhu, William AP Smith, Sebastian Deterding, and Patrik Huber. "Reconstructing Creative Lego Models." In wProceedings of the Asian Conference on Computer Vision. 2020.
  6. Lennon, Kyle, Katharina Fransen, Alexander O'Brien, Yumeng Cao, Matthew Beveridge, Yamin Arefeen, Nikhil Singh, and Iddo Drori. "Image2lego: Customized lego set generation from images." arXiv preprint arXiv:2108.08477 (2021).

Upodabljanje volumnov z Gaussovimi packami

Kontakt: doc. dr. Ciril Bohak

Sodobni pristopi k upodabljanju volumetričnih scen se zanašajo na rekonstrukcijo scen z različnimi modeli za predstavitev scen kot so NeRF. Še novejši pristopi uporabljajo predstavitev scen z Gaussovimi packami [1], ki so jih nedavno prilagodili tudi za dinamične scene [2]. Cilj naloge je razviti ekvivalenten pristop za vizualizacijo segmentiranih volumetričnih podatkov na spletu z uporabo standarda WebGPU.

Literatura:

  1. Kerbl, Bernhard, Georgios Kopanas, Thomas Leimkühler, and George Drettakis. "3d gaussian splatting for real-time radiance field rendering." ACM Transactions on Graphics (ToG) 42, no. 4 (2023): 1-14.
    https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/
  2. Luiten, Jonathon, Georgios Kopanas, Bastian Leibe, and Deva Ramanan. "Dynamic 3D Gaussians: Tracking by Persistent Dynamic View Synthesis." arXiv preprint arXiv:2308.09713 (2023).
    https://dynamic3dgaussians.github.io

Proceduralna vizualizacija subceličnih struktur

Kontakt: doc. dr. Ciril Bohak

V posamezni celici se nahaja veliko število organelov in drugih struktur (npr. jedro, mitohondriji, golgijevi aparati, fuziformni vezikli, mikrotubuli ipd.), ki jih lahko prepoznamo v mikroskopskih podatkih zajetih z najnovejšimi pristopi v elektronski mikroskopiji (Focused Ion Beam Scanned Electronic Microscopy - FIB-SEM). Cilj naloge je na podlagi segmentiranih subceličnih struktur izdelati vizuelni model izbrane vrste struktur, ki nam omogoča proceduralno generiranje takšnih struktur in njihovo populacijo znotraj posamezne celice.

Literatura:

  1. T. Klein, I. Viola, Meister E. Gröller and P. Mindek Multi-Scale Procedural Animations of Microtubule Dynamics Based on Measured Data. IEEE Transactions on Visualization and Computer Graphics, 2019.
  2. P. Mindek, D. Kouřil, J. Sorger, D. Toloudis, B. Lyons, G. Johnson, Meister E. Gröller, I. Viola Visualization Multi-Pipeline for Communicating Biology. IEEE Transactions on Visualization and Computer Graphics, 24(1), 2017.

Avtomatska segmentacija celičnih predelkov iz mikroskopskih slik

Kontakt: doc. dr. Ciril Bohak

V  posamezni celici se nahaja veliko število organelov in drugih struktur (npr. jedro, mitohondriji, golgijevi aparati, fuziformni vezikli, mikrotubuli ipd.), ki jih lahko prepoznamo v mikroskopskih podatkih, zajetih z najnovejšimi pristopi v elektronski mikroskopiji. Cilj naloge je segmentirati različne strukture znotraj celice. Naloga v sodelovanju z Inštitutom za biologijo celice. V okviru naloge želimo preizkusiti najnovejše segmentacijske pristope in jih ovrednotiti na bioloških podatkih.

Literatura:

  1. Kirillov, Alexander, Eric Mintun, Nikhila Ravi, Hanzi Mao, Chloe Rolland, Laura Gustafson, Tete Xiao et al. "Segment anything." arXiv preprint arXiv:2304.02643 (2023).
    https://github.com/facebookresearch/segment-anything
  2. Ma, Jun, and Bo Wang. "Segment anything in medical images." arXiv preprint arXiv:2304.12306 (2023).
  3. Mazurowski, Maciej A., Haoyu Dong, Hanxue Gu, Jichen Yang, Nicholas Konz, and Yixin Zhang. "Segment anything model for medical image analysis: an experimental study." Medical Image Analysis 89 (2023): 102918.
  4. He, Sheng, Rina Bao, Jingpeng Li, P. Ellen Grant, and Yangming Ou. "Computer-Vision Benchmark Segment-Anything Model (SAM) in Medical Images: Accuracy in 12 Datasets." arXiv preprint arXiv:2304.09324 (2023).
  5. Wu, Junde, Rao Fu, Huihui Fang, Yuanpei Liu, Zhaowei Wang, Yanwu Xu, Yueming Jin, and Tal Arbel. "Medical sam adapter: Adapting segment anything model for medical image segmentation." arXiv preprint arXiv:2304.12620 (2023).
  6. Zhang, Kaidong, and Dong Liu. "Customized segment anything model for medical image segmentation." arXiv preprint arXiv:2304.13785 (2023).

Avtomatsko odpravljanje deformacij, ki se pojavijo ob pridobivanju volumetričnih slik z elektronskim mikroskopom

Kontakt: prof. dr. Matija Marolt

Ob zajemu volumetričnih podatkov celic z elektronskim mikroskopom se zaradi izjemno zahtevnega postopka zelo pogosto pojavijo deformacije opazovanih celičnih struktur. Na primer: fuziformni vezikli se včasih pri fiksaciji vozrca napihnejo. Vzorec kljub dolgotrajnemu postopku pridobivanja zaradi deformacij postane manj uporaben.

Cilj naloge je pripraviti avtomatski pristop za odpravljanje takih deformacij. Naloga se izvaja v sodelovanju z Inštitutom za biologijo celice.

Orodje za obdelavo podatkov, pridobljenih z vrstičnim elektronskim mikroskopom
Kontakt: Žiga Lesar

V znanosti o materialih se za zajem podatkov pogosto uporablja vrstična elektronska mikroskopija, natančneje sistem za uklon povratno sipanih elektronov (angl. electron backscatter diffraction - EBSD). Tako pridobljeni podatki razkrivajo mnoge lastnosti materialov, npr. orientacijo kristalov, obremenitev, napetost, defekte itd. Ker je EBSD zajem izključno dvodimenzionalen, lahko volumetrične podatke pridobimo le z lepljenjem slik posameznih slojev. Namen magistrske naloge je razvoj spletnega orodja, ki poenostavi obdelavo EBSD slik in omogoča meritve v volumetričnih podatkih, denimo izračun in vizualizacijo sprememb parametrov vzdolž poljubnih osi.

Literatura:

  1. A. J. Schwartz, M. Kumar, B. L. Adams, D. P. Field. Electron backscatter diffraction in materials science. New York, Kluwer Academic. 2000.
  2. B. Šetina Batič, M. Jenko. Structuring polycrystalline Fe‐Si‐Al steel surfaces by means of ion beam–the role of grain orientation. Surface and Interface Analysis. 2010.

Primerjava kompresijskih algoritmov za stiskanje volumnov
Kontakt: Žiga Lesar

Kompresija podatkov je v računalniški grafiki bistvenega pomena za obvladovanje ozkega grla pri pomnilniških dostopih. Manjša uporaba pomnilniškega vodila vodi do hitrejših in bolj učinkovitih programov, poleg tega pa zmanjšuje porabo energije, kar je kritičnega pomena na mobilnih napravah. Medtem ko je kompresija 2D slik in videov napredovala vedno bližje teoretičnim mejam, je kompresija statičnih in dinamičnih volumnov ostala primitivna, kljub temu da so volumni bistveno bolj prostorsko požrešni. Ločimo več vrst kompresijskih shem, ki se razlikujejo predvsem v hitrosti kompresije in dekompresije, hitrosti dostopa do poljubnih podatkov, kompresijskem razmerju in rekonstrukcijski napaki. Cilj te magistrske naloge je implementirati obstoječe in razviti nove pristope za kompresijo volumnov in volumetričnih videov ter jih temeljito analizirati. Implementacije bodo vključene v ogrodje VPT in dodane v specifikacijo formata BVP kot opcijske razširitve.

Literatura:

  1. H. Yela, I. Navazo, P. Vázquez. S3Dc: a 3Dc-based volume compression algorithm. Congreso Español de Informática Gráfica (CEIG), 2008.
  2. J. Nystad, A. Lassen, A. Pomianowski, S. Ellis, T. Olson. Adaptive Scalable Texture Compression. Eurographics/ACM SIGGRAPH Symposium on High Performance Graphics, 2012.
  3. P. Kohlmann, S. Bruckner, A. Kanitsar, E. Gröller. Evaluation of a Bricked Volume Layout for a Medical Workstation based on Java. Journal of WSCG, 2007.
  4. M. Balsa Rodríguez, E. Gobbetti, J.A. Iglesias Guitián, M. Makhinya, F. Marton, R. Pajarola, S.K. Suter. State-of-the-Art in Compressed GPU-Based Direct Volume Rendering. Computer Graphics Forum, 2014.

Nevronsko medpomnjenje dinamične osvetlitve volumnov
Kontakt: doc. dr. Ciril Bohak

Medpomnjenje osvetlitve volumnov [1] omogoča znatne pohitritve volumetričnega upodabljanja, saj je ravno pravilen izračun oz. vzorčenje osvetlitve eden izmed najbolj potratnih delov upodabljanja. Takšno medpomnjenje lahko implementiramo na različne načine, npr. v obliki statičnih osvetlitvenih volumnov za aproksimacijo fiksne osvetlitve. Osvetlitveni volumni so lahko različnih resolucij, saj lahko že z manjšim volumnom dobro aproksimiramo osvetlitev celotnega volumna. Ideja te magistrske naloge pa je nevronsko medpomnjenje dinamične osvetlitve volumnov. Podobni prisotpi so bili že raziskani za nevronsko upodabljanje dinamičnih scen [2], ne pa tudi za hranjenje dinamične osvetlitve modelov.

Literatura:

  1. Krivánek, J., Gautron, P., Pattanaik, S., & Bouatouch, K. (2005). Radiance caching for efficient global illumination computation. IEEE Transactions on Visualization and Computer Graphics, 11(5), 550-561.
  2. Pumarola, A., Corona, E., Pons-Moll, G., & Moreno-Noguer, F. (2021). D-nerf: Neural radiance fields for dynamic scenes. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10318-10327).
  3. Kallweit, Simon, Thomas Müller, Brian Mcwilliams, Markus Gross, and Jan Novák. "Deep scattering: Rendering atmospheric clouds with radiance-predicting neural networks." ACM Transactions on Graphics (TOG) 36, no. 6 (2017): 1-11.

Rekonstrukcija oblik celičnih predelkov iz segmentiranih mikroskopskih podatkov

Kontakt: doc. dr. Ciril Bohak

Pri segmentaciji objektov v volumetričnih predstavitvah so dobljene strukture predstavljene z voksli, ki hranijo verjetnost, da določen voksel pripada neki segmentirani strukturi. Te strukture pogosto ustrezajo nekim približnim oblikam, na primer pri mikroskopskih podatkih mitohondrijem v celicah. Za boljšo rekonstrukcijo 3D oblik tako želimo dobljene segmentirane oblike predstaviti s čim bolj pravilnimi površinami. Tako je potrebno za posamezni tip struktur izbrati primerne omejitve in jih uporabiti pri rekonstruiranju 3D geometrije.

Literatura:

  1. K. V. Kaltdorf, K. Schulze, F. Helmprobst, P. Kollmannsberger, T. Dandekar, C. Stigloher FIJI Macro 3D ART VeSElecT: 3D Automated Reconstruction Tool for Vesicle Structures of Electron Tomograms, 2017
  2. M. Rouhani, A. D. Sappa, E. Boyer Implicit B-Spline Surface Reconstruction, 2015.

Nevronsko upodabljanje oblakov točk površja na spletu
Kontakt: doc. dr. Ciril Bohak

V zadnjih letih so podatki površja zemlje zajeti na veliko načinov: (1) Iz letal s tehnologijo LiDAR, (2) 360° posnetki in globinske slike zajete iz avtomobilov (npr. Google Maps), in (3) satelitski posnetki površja. Vse naštete modalnosti zajamejo podatke pri precej različnih resolucijah z različno natančnostjo. Prav tako so podatki zajeti iz različnih zornih kotov in posledično zajemajo pogled na objekte iz različnih zornih kotov.

Ideja naloge je priprava učnih podatkov in učenje modela za nevronsko upodabljanje površja zemlje iz redkega oblaka točk, ki kjer točke poleg položajev hranijo tudi barvno informacijo. Končni cilj je naučen nevronski model za upodabljanje uporabiti v spletni aplikaciji za interaktivno upodabljanje. Pri tem je namen uporabiti spletno ogrodje RenderCore v tehnologiji WebGPU v kombinaciji z wonnx za inferenco na spletu z uporabo WebGPU.

Literatura:

  1. Kerbl, Bernhard, Georgios Kopanas, Thomas Leimkühler, and George Drettakis. "3d gaussian splatting for real-time radiance field rendering." ACM Transactions on Graphics (ToG) 42, no. 4 (2023): 1-14.
    https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/
  2. P. Dai, Y. Zhang, Z. Li, S. Liu, B. Zeng. Neural Point Cloud Rendering via Multi-Plane Projection. Conference on Computer Vision and Pattern Recognition (CVPR), 2020
    https://daipengwa.github.io/NeuralPointCloudRendering_ProjectPage/
  3. WONNX Fast deep learning on any device
    https://github.com/webonnx/wonnx

Izdelava kart, načrtov in zemljevidov iz ortofoto posnetkov s prenosom stila
Kontakt: doc. dr. Ciril Bohak

Izdelava namenskih kart ali zemljevidov za potrebe promocije, načrtovanja, ali kakšne drugačne namenske uporabe večinoma poteka ročno s strani strokovnjakov ali umetnikov odvisno od namena uporabe. Z napredkom novih tehnologij predvsem na področju globokega učenja je mogoče veliko takšnih postopkov avtomatizirati. Namen te naloge je pregledati obstoječe pristope za prenos stila in njihovo ovrednotenje za podane namene. Nadalje želimo razviti lastni pristop prilagojen prav za zemljevide in demonstrirati njegovo uporabo na praktičnih primerih. Pri tem želimo ugotoviti kako dobro je mogoče zagotoviti ohranitev izbranih lastnosti (položaj željenih elementov, razmerja, razdalje, …). Uporabo razvitega pristopa želimo demonstrirati tudi na praktičnih primerih (npr. izdelava zemljevidov ali mini-mapa za igre, izdelava stiliziranega zemljevida kakšnega kraja s poudarjenimi ciljnimi objekti, …)

Literatura:

  1. Nejc Krajšek, “Prenos stila računalniško generiranih ortofoto posnetkov pokrajine v realistični izgled”
    https://repozitorij.uni-lj.si/IzpisGradiva.php?id=149963&lang=slv
  2. Kirillov, Alexander, Eric Mintun, Nikhila Ravi, Hanzi Mao, Chloe Rolland, Laura Gustafson, Tete Xiao et al. "Segment anything." arXiv preprint arXiv:2304.02643 (2023).
    https://github.com/facebookresearch/segment-anything
  3. Karim Jedda. “Transform boring charts into beautiful information with Stable Diffusion”
    https://karimjedda.com/beautiful-data-visualizations-powered-by-generative-ai/
  4. Rombach, Robin, Andreas Blattmann, Dominik Lorenz, Patrick Esser, and Björn Ommer. "High-resolution image synthesis with latent diffusion models." In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, pp. 10684-10695. 2022.
    https://github.com/Stability-AI/stablediffusion
    https://github.com/CompVis/stable-diffusion
  5. Zhang, Lvmin, and Maneesh Agrawala. "Adding conditional control to text-to-image diffusion models." arXiv preprint arXiv:2302.05543 (2023).
    https://github.com/lllyasviel/ControlNet

Oddano

Inkrementalna rekonstrukcija slike iz razpršenih podatkov

Kontakt: Žiga Lesar

V računalniški grafiki moramo pogosto zmanjšati količino podatkov, da naše metode delujejo v realnem času. Pri metanju žarkov na primer želimo zmanjšati število svetlobnih žarkov, ki jih pošljemo v sceno, saj je količina žarkov neposredno povezana s hitrostjo upodabljanja. Več žarkov lahko pošljemo v delih slike, kjer pričakujemo več detajlov, manj žarkov pa v bolj homogene dele slike. Ker so žarki naključno razporejeni po končni sliki, govorimo o razpršenih podatkih. Za prikaz na zaslonu moramo končno sliko rekonstruirati iz razpršenih podatkov, tako da za vsak piksel izračunamo njegovo barvo. Cilj diplomske naloge je razvoj algoritma za rekonstrukcijo slike iz tovrstnih razpršenih podatkov. Ker lahko nabor razpršenih podatkov sproti razširjamo z dodajanjem novih žarkov, mora algoritem delovati inkrementalno, torej mora nove podatke čim hitreje vključiti v rekonstrukcijo. Razvita metoda bo uporabna ne le pri metanju žarkov, temveč tudi pri vizualizaciji oblakov točk, kompresiji slik in rekonstrukciji izgubljenih podatkov.

Stabilna difuzija v spletnem brskalniku

Kontakt: doc. dr. Ciril Bohak

V zadnjem času so veliko pozornosti pritegnili pristopi za proceduralno generiranje slik na podlagi podanega opisa z uporabo tekstovnih modelov. Modeli kot so Dall-E 1&2&Mini [1], Imagen [2] niso javno dostopni in brezplačno ponujajo zgolj generiranje manjših slik. Po drugi strani pa je pristop Stable Diffusion [3] izdan povsem odprtokodno in ga lahko uporabi vsakkdo. Pristop omogoča širok nabor uporab, od generiranja slik, do vrisavanja, dorisavanja, dodajanja podrobnosti in še kaj. Za delovanje pa je trenutno nujna postavitev v prilagojenem okolju. Različni uporabniki so že razvili vrsto vmesnikov, ki interaktira s postavitvijo na strežnikih. Ideja te magistrske naloge pa je, da se stabilno difuzijo prenese v izvedbo v sam brskalnik z uporabo ogrodja ONNX [4,5 ] in da se za njegovo uporabo razvije primeren grafični uporabniški vmesnik.

  1. Open AI, DALL-E 2: https://openai.com/dall-e-2/
  2. Google, Imagen: https://imagen.research.google
  3. Stable Diffusion: https://github.com/CompVis/stable-diffusion
  4. ONNX, https://onnx.ai
  5. WONNX Fast deep learning on any device
    https://github.com/webonnx/wonnx

Izboljšanje kvalitete video posnetkov v realnem času

Kontakt: prof. dr. Matija Marolt

TV signali, še posebej v SD, vsebujejo precej popačenj slike, ki nastanejo kot posledica video kompresije. V nalogi boste preučili kako lahko izboljšamo kvaliteto video posnetkov z uporabo modelov globokega učenja in izdelali sistem, ki bo v realnem času tekel na platformi Nvidia Jetson Xavier.