Google bu yaxınlarda süni intellekt vasitəsilə video yaratmaq üçün Veo 3 modelini istifadəyə verdi. Veo 3, mətn və ya şəkil sorğularını yüksək keyfiyyətli videolara çevirməklə yanaşı, bu videolara səs də əlavə edə bilir. Nəticədə, AI ilə diyaloqlar, arxa fona uyğun musiqilər və ətraf səsləri yaratmaq mümkün olur.
Hazırda Veo 3-ə Gemini-dəki Google AI Pro planı və ya Vertex AI platforması vasitəsilə giriş mümkündür.
Bəs Veo 3-ü Sora kimi digər video yaradıcılarından nə fərqləndirir?
Videolara real vaxt uyğunluğunda səs əlavə etmək
Bu, Veo 3-ün digər generativ video alətlərindən əsas fərqlərindən biridir. Hazırda bu funksiyanı digər AI modelləri tam şəkildə təqdim edə bilmir.
“Veo 3 mətndən və şəkildən başa düşərək real dünya fizikası və dəqiq dodaq sinxronizasiyası sahəsində üstünlük göstərir,” – deyə Google DeepMind-in məhsul üzrə vitse-prezidenti Eli Collins qeyd edib.
1080p keyfiyyət və 60 saniyəyə qədər video uzunluğu
Veo 3 Full HD (1080p) formatında və maksimum 1 dəqiqəlik videolar yarada bilir. Eyni zamanda, bu videolar yüksək vizual sabitlik və ardıcıl sinxronizasiya ilə seçilir. Bu isə istifadəçilərə sadəcə deatllı sorğular yazmaqla film səhnəsi səviyyəsində keyfiyyətli və real videolar yaratmaq imkanı verir.
Multimodal anlayış və rejissorluq elementləri
Veo 3 multimodal süni intellekt anlayışına malikdir. Bu o deməkdir ki, model yalnız mətn və şəkli başa düşməklə kifayətlənmir, eyni zamanda stilistika, kamera hərəkətləri, işıqlandırma, rəng tonu və atmosfer kimi rejissorluq elementlərini də anlayır. Bu xüsusiyyətlər, yaradılan videoların daha təbiiliyi və vizual zənginliyi təmin edir.
Bu yeniliklər generativ süni intellekt sahəsində video və şəkil yaradılmasının sürətlə populyarlaşdığını göstərir. OpenAI-nin CEO-su Sam Altman, mart ayında bildirib ki, ChatGPT 4o versiyasındakı şəkil generatoru o qədər məşhurlaşıb ki, şirkətin hesablama çipləri sözün əsl mənasında "əriyib".
Veo 3 istifadəçilərə yüksək keyfiyyətli, səs sinxronizasiyalı və təbiiliyə yaxın videolar yaratmaq üçün yeni bir yaradıcı platforma təqdim edir. Əlbəttə, bəzi çatışmazlıqları mövcuddur — məsələn, promptların sürüşməsi və ara-sıra baş verən vizual qüsurlar. Amma əsas təcrübə əslində olduqca həyəcanverici və perspektivlidir.