
UI v januarju: kaj smo pridobili in kaj nas še čaka
Če je januar deloval nekoliko počasneje v primerjavi s prejšnjimi meseci, nas videz resnično vara. Ta mesec nam je namreč prinesel številne novosti, ki bodo močno poenostavile naše delo.

Luka Tišler
Luka Tišler
Pri Luma Labs so predstavili nov videomodel Ray 2, ki ponuja bolj kakovostne videe, ustvarjene s tekstovnimi ukazi. Nekateri ga primerjajo z Googlovim modelom Veo-2, vendar menim, da še ne gre tako daleč – za res dober video je potrebnih kar nekaj poskusov. Poleg tega so pri Lumi šli še korak dlje in predstavili videopovečevalnik, ki poveča videe do 4K resolucije.
Pika ni mirovala, saj je izdala različico 2.1, ki je precej boljša od prejšnjega modela. Zdaj lahko proizvaja 5-sekundne videe v 1080p resoluciji, vendar je še vedno ne bi uvrstil med najbolj kakovostne video UI-generatorje.
Kling, eden od najboljših videogeneratorjev, je »ukradel« idejo Pike in predstavil funkcijo »Elements«. Ta omogoča vnos referenčnih slik v video, ki jih Kling nato vključi v ustvarjeni material. Zdaj lahko sami nadzorujemo okolje in igralce v UI-videih.
Kitajsko božično darilo
Kitajski Hailuo nas je v januarju presenetil z božičnim darilom. Zdaj lahko, podobno kot pri Klingu, v videe vstavljamo svoje igralce, poleg tega pa imamo na voljo tudi funkcijo »Director«, ki omogoča nadzor nad premiki kamere.
Če že omenjam Kitajsko, velja izpostaviti tudi svež multimodalni model Qwen 2.5, ki brezplačno generira tekst, slike in videe. Kakovost videoposnetkov je impresivna in v prihodnosti ga vidim kot močnega konkurenta najboljšim videomodelom.
Kitajski ponudnik HunYuan, ki svoje izdelke ponuja v odprti kodi, se je podal tudi na 3D-področje. Njihov model omogoča pretvorbo slik v 3D-objekte, ki jih lahko uporabimo kot elemente v igrah ali za 3D-tiskanje.
Novi UI-agent podjetja OpenAI
Runway, eden od najbolj priljubljenih video generatorjev, je predstavil generator slik »Frames«. Te slike imajo izrazito filmski videz in ko jih uporabimo s funkcijo image-to-video, so rezultati fantastični.
OpenAI je razkril prvega UI-agenta, ki deluje v okolju ChatGPT – »Operator«. Čeprav je agent še precej okoren in počasen, sem prepričan, da bo kmalu postal del našega vsakdana. Poleg tega smo v Evropi pred nekaj dnevi pridobili dostop do najpametnejšega modela o3, ki je bistveno hitrejši in pametnejši od prejšnjega modela o1.
DeepSeek R1 kot izjemno solidna alternativa uveljavljenim UI-modelom
Seveda pa ne moremo mimo novice, ki ni pretresla le UI-sveta, ampak je tudi močno vplivala na finančne trge. Kitajcem je namreč uspelo ne le sklonirati, temveč tudi izboljšati (na nekaterih področjih) ChatGPT – vse to v nekaj mesecih za »pičlih« 5 milijonov dolarjev. DeepSeek R1 je izjemno solidna alternativa uveljavljenim UI-modelom, predvsem zaradi boljše odzivnosti in nižje cene, vendar ima težave pri temah, ki niso po volji kitajski partiji.
UI sama po sebi ne more biti avtorsko zaščitena
Za konec pa še novica, ki bo močno vplivala na produkcijo UI-vizualov. Poročilo Urada za avtorske pravice ZDA je ugotovilo, da umetna inteligenca sama po sebi ne more biti avtorsko zaščitena. Ključna je človeška ustvarjalnost za upravičenost do avtorske zaščite, saj samo »promptanje« ni dovolj. UI se lahko uporablja kot orodje v širšem ustvarjalnem procesu, na primer pri izdelavi filmov ali umetniških del, kjer je človeški prispevek ključen.