70 / 100

Da vještačka inteligencija uzima maha uvjerili smo se u prethodnom periodu. U kratom periodu smo vidjeli koliko je zapravo moćna i čak su neki i u malom strahu da će možda u budućnosti ostati bez posla i da će ih zamjeniti Chat botovi koji postaju sve razvijeniji i pristupačniji, ali svakako da sa novim dostignućima dolaze i nove opcije.Sada je na red došao i novi model koji pretvara tekst (promt) u video, pročitajte o tome u nastavku.

AI Sora je model koji pretvara tekst u video, razvijen od strane OpenAI, organizacije za istraživanje veštačke inteligencije iz SAD. Ovaj model može da generiše video zapise prema opisnim i tekstualnim uputstvima, da proširi postojeće video zapise u vremenu unapred ili unazad, i da stvori video zapise iz nepokretnih slika.

OpenAI je nedavno najavio svoju najnoviju tehnologiju – Sora, model generativne AI koji pretvara tekst u video. Sora donosi vašu viziju u život, prikazujući složene detalje, dinamična kretanja kamere, pa čak i interakcije likova.

AI Sora je model koji omogućava stvaranje video zapisa iz teksta. Jednostavno, kada unesete tekstualnu komandu, Sora brzo stvara video koji odgovara opisu vaše komande.

Ranije su razvijeni brojni modeli za generisanje videa iz teksta, uključujući Meta’s Make-A-Video, Google’s Lumiere i Runway’s Gen-2.

OpenAI, koji je razvio Sora, takođe je lansirao DALL·E 3 u septembru 2023. Ime Sora, što na japanskom znači „nebo“, odabrano je da simbolizuje „neograničeni potencijal za kreativnost“.

Firma je 15. februara 2024. prvi put prikazala Sora puštanjem brojnih klipova visoke definicije koje je kreirala. Uključeni su animacija „kratkog pufnastog čudovišta“, „SUV vožnja niz planinski put“, „životinje koje voze bicikle u moru“, i napomenuto je da može generisati video zapise do jednog minuta.

OpenAI je takođe najavio da će uskoro učiniti Soru dostupnom javnosti, mada datum još nije određen.

AI Sora je takođe korišćena za testiranje protiv dezinformacija i pristrasnosti, i deljena je s grupom kreativnih profesionalaca za povratne informacije o njenoj korisnosti u kreativnim oblastima.


Kako funkcioniše Open AI Sora?

Slično modelima generativne AI za pretvaranje teksta u sliku, kao što su DALL·E 3, StableDiffusion i Midjourney, Sora se smatra difuznim modelom.

To jednostavno znači da počinje sa svakim frejmom videa koji se sastoji od statične buke i koristi mašinsko učenje kako bi transformisala slike u nešto što liči na opis u naredbi.

Međutim, video zapisi Open AI Sora mogu trajati do 60 sekundi, tj. jedan minut.

Sora AI se koristi za stvaranje videa od početka ili za proširenje postojećih videa, što olakšava generisanje videa bez potrebe za tehničkim veštinama uređivanja slika.

AI Sora nije još dostupna javnosti, ali se pristup njoj trenutno daje odabranim stručnjacima i kreatorima sadržaja za testiranje. Očekuje se da će, uzimajući u obzir povratne informacije, Sora moći da unapredi kako kreativne procese tako i interakcije ljudi sa AI.

Šta kažu drugi o ovom modelu?

TED Talks, čuvena platforma za predstavljanje raznih ideja kroz kratka, snažna izlaganja ovako je to predstavila na X-u.

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *