جیمکس ادز / جی مگ / مقالات تکنولوژی / مدل ویدیویی جدید Veo 2 توسط Google DeepMind معرفی شد

مدل ویدیویی جدید Veo 2 توسط Google DeepMind معرفی شد

آواتار مهشید عشوری مهشید عشوری زمان انتشار: 1403/09/28
آخرین به‌روز‌رسانی: 1403/09/28 زمان مطالعه: 3 دقیقه
مدل ویدیویی جدید Veo 2 توسط Google DeepMind معرفی شد
تبلیغ گوگل

Google DeepMind، آزمایشگاه تحقیقاتی هوش مصنوعی گوگل، قدمی بزرگ در دنیای تولید ویدیوهای هوش مصنوعی برداشته است. این آزمایشگاه به تازگی از نسخه جدید مدل ویدیویی خود به نام Veo 2 رونمایی کرده که قابلیت هایی فراتر از مدل رقیب، Sora از OpenAI، ارائه می دهد.

ویژگی های برجسته Veo 2

Veo 2 قادر است کلیپ هایی با وضوح 4K (4096×2160 پیکسل) و مدت زمان بیش از دو دقیقه تولید کند. این ویژگی، وضوحی چهار برابر بیشتر و مدت زمانی شش برابر طولانی تر از توانایی های فعلی مدل Sora ارائه می دهد.

اگرچه در حال حاضر این قابلیت ها به صورت کامل عملیاتی نشده اند، کاربران ابزار آزمایشی VideoFX گوگل می توانند از Veo 2 برای تولید ویدیوهایی با کیفیت 720p و مدت زمان حداکثر 8 ثانیه استفاده کنند. با این حال، گوگل اعلام کرده که در هفته های آینده دسترسی کاربران بیشتری به این ابزار فراهم خواهد شد.

پیشرفت های مهم در Veo 2

Veo 2 نسبت به نسخه قبلی خود (Veo) بهبودهای چشمگیری داشته است:

  1. کیفیت تصویر واضح تر: بافت ها و تصاویر در کلیپ های تولید شده بسیار شفاف تر و واقعی تر هستند، به ویژه در صحنه های پرتحرک.
  2. کنترل های بهبودیافته دوربین: این مدل می تواند موقعیت دوربین مجازی را با دقت بیشتری تنظیم کند و از زوایای مختلف، اشیا و افراد را ثبت کند.
  3. مدل سازی پیشرفته حرکت و دینامیک مایعات: Veo 2 حرکات سریع، دینامیک مایعات (مانند ریختن قهوه) و انعکاس های نور را با دقت بیشتری شبیه سازی می کند.

این قابلیت ها باعث شده تا Veo 2 توانایی شبیه سازی حرکات پیچیده و ایجاد افکت های سینمایی مانند سایه ها و انعکاس های نور را داشته باشد.

مطالعه بیشتر:  استراتژی اپل: افشاگری تاریخ معرفی و عرضه آیفون ۱۶

چالش های پیش روی Veo 2

با وجود پیشرفت های چشمگیر، این مدل هنوز با برخی چالش ها روبه رو است:

  • هماهنگی طولانی مدت با درخواست های پیچیده: این مدل نمی تواند به صورت کامل به درخواست های چندلایه و طولانی مدت پایبند بماند.
  • جزئیات ظریف و حرکات سریع: ایجاد جزئیات بسیار پیچیده یا شبیه سازی حرکات بسیار سریع همچنان جای پیشرفت دارد.
  • شخصیت پردازی: مدل در ایجاد چهره های واقعی تر یا حفظ ظاهر یکنواخت شخصیت ها در طول ویدیو با محدودیت هایی مواجه است.

کاربردها و آینده Veo 2

گوگل قصد دارد از Veo 2 در پلتفرم های مختلف خود استفاده کند. این مدل به زودی در Vertex AI، پلتفرم توسعه دهندگان گوگل، در دسترس قرار خواهد گرفت و در ماه های آینده قابلیت های بیشتری به آن افزوده می شود.

تبلیغ گوگل

تدابیر امنیتی و جلوگیری از سوءاستفاده

برای جلوگیری از سوءاستفاده از این فناوری در تولید دیپ فیک ها، DeepMind از فناوری واترمارک اختصاصی خود به نام SynthID استفاده می کند. این واترمارک به صورت نامرئی در فریم های ویدیو تعبیه می شود، اما مانند تمام فناوری های واترمارک، کاملاً نفوذناپذیر نیست.

ارتقا مدل تصویری Imagen 3

علاوه بر Veo 2، Google DeepMind از نسخه جدید مدل تولید تصویر خود، Imagen 3، رونمایی کرده است. این مدل که برای کاربران ابزار ImageFX در دسترس است، توانایی های بیشتری در ایجاد تصاویر روشن تر، دقیق تر و با جزئیات بیشتر دارد.

کاربران همچنین می توانند با استفاده از رابط کاربری جدید ImageFX، از پیشنهادات هوشمند برای ایجاد تصاویر متنوع و خلاقانه استفاده کنند.

مطالعه بیشتر:  گوگل سرچ ویژگی جدید "Ask for me" را معرفی کرد

نتیجه گیری

Google DeepMind با معرفی Veo 2 قدمی بلند در عرصه تولید ویدیوهای هوش مصنوعی برداشته است. این فناوری نوآورانه، با قابلیت های بی نظیر و پتانسیل گسترده، می تواند تحولی در حوزه تولید محتوای ویدیویی ایجاد کند. با این حال، چالش هایی همچون بهبود جزئیات ویدیو و افزایش هماهنگی با درخواست های پیچیده هنوز نیازمند کار بیشتر است.

بیشتر بخوانید:

روش های تماشای ویدیو در یوتیوب بدون تبلیغ | چگونگی حذف تبلیغات یوتیوب

معرفی ابزار ساخت متن ویدیو با هوش مصنوعی VEED

تبلیغ گوگل
آواتار مهشید عشوری
مهشید عشوری

من مهشید عشوری، نویسنده و تولیدکننده محتوای جیمکس ادز و شیفته دنیای سئو هستم. عاشق نوشتن درمورد یوتیوب، درآمد دلاری و تبلیغات گوگلم. هدف من توی جیمکس نوشتن محتواهای به روزی هست که مسیر نقد درآمد یوتیوب و تبلیغ در گوگل رو برای شما هموار کنه

نظرات کاربران درباره پست 0 دیدگاه ثبت شده
نظرات خود را درباره این سرویس ثبت کنید

نوشته های مشابه

ترکیب جستجوی گوگل با یادگیری درون متنی (LLM In-Context Learning)
ترکیب جستجوی گوگل با یادگیری درون متنی (LLM In-Context Learning)

در دنیای پرشتاب فناوری‌های نوین، یادگیری درون متنی (In-Context Learning) و جستجوی گوگل دو مفهومی هستند که به طور قابل توجهی در حال تغییر تجربه کاربران در تعامل با فناوری‌های...

ویژگی های دوربین هوش مصنوعی گوگل پیکسل ۹
ویژگی های دوربین هوش مصنوعی گوگل پیکسل ۹

گوشی‌های هوشمند پیکسل گوگل همواره به خاطر سیستم‌های دوربین فوق‌العاده خود شناخته شده‌اند. اما در سال‌های اخیر، این شرکت با افزودن قابلیت‌های هوش مصنوعی به...

Eightify خلاصه ای از ویدیو یوتیوب به شما می دهد
Eightify خلاصه ای از ویدیو یوتیوب به شما می دهد

اگر تا به حال خواسته اید یک ویدئوی طولانی در یوتیوب را سریع تر و به شکل خلاصه  شده ببینید، ابزار هوش مصنوعی Eightify دقیقاً برای همین نیاز طراحی شده است. Eightify یک افزونه...