جیمکس / جی مگ / مقالات تکنولوژی / مدل ویدیویی جدید Veo 2 توسط Google DeepMind معرفی شد

مدل ویدیویی جدید Veo 2 توسط Google DeepMind معرفی شد

زمان آخرین آپدیت: 1403/09/28 زمان مطالعه: 3 دقیقه
مدل ویدیویی جدید Veo 2 توسط Google DeepMind معرفی شد
تبلیغ گوگل

Google DeepMind، آزمایشگاه تحقیقاتی هوش مصنوعی گوگل، قدمی بزرگ در دنیای تولید ویدیوهای هوش مصنوعی برداشته است. این آزمایشگاه به تازگی از نسخه جدید مدل ویدیویی خود به نام Veo 2 رونمایی کرده که قابلیت هایی فراتر از مدل رقیب، Sora از OpenAI، ارائه می دهد.

ویژگی های برجسته Veo 2

Veo 2 قادر است کلیپ هایی با وضوح 4K (4096×2160 پیکسل) و مدت زمان بیش از دو دقیقه تولید کند. این ویژگی، وضوحی چهار برابر بیشتر و مدت زمانی شش برابر طولانی تر از توانایی های فعلی مدل Sora ارائه می دهد.

اگرچه در حال حاضر این قابلیت ها به صورت کامل عملیاتی نشده اند، کاربران ابزار آزمایشی VideoFX گوگل می توانند از Veo 2 برای تولید ویدیوهایی با کیفیت 720p و مدت زمان حداکثر 8 ثانیه استفاده کنند. با این حال، گوگل اعلام کرده که در هفته های آینده دسترسی کاربران بیشتری به این ابزار فراهم خواهد شد.

پیشرفت های مهم در Veo 2

Veo 2 نسبت به نسخه قبلی خود (Veo) بهبودهای چشمگیری داشته است:

  1. کیفیت تصویر واضح تر: بافت ها و تصاویر در کلیپ های تولید شده بسیار شفاف تر و واقعی تر هستند، به ویژه در صحنه های پرتحرک.
  2. کنترل های بهبودیافته دوربین: این مدل می تواند موقعیت دوربین مجازی را با دقت بیشتری تنظیم کند و از زوایای مختلف، اشیا و افراد را ثبت کند.
  3. مدل سازی پیشرفته حرکت و دینامیک مایعات: Veo 2 حرکات سریع، دینامیک مایعات (مانند ریختن قهوه) و انعکاس های نور را با دقت بیشتری شبیه سازی می کند.

این قابلیت ها باعث شده تا Veo 2 توانایی شبیه سازی حرکات پیچیده و ایجاد افکت های سینمایی مانند سایه ها و انعکاس های نور را داشته باشد.

مطالعه بیشتر:  ایکس باکس گیم پس (Game Pass) چیست ؟ هر آنچه که از گیم پس باید بدانید

چالش های پیش روی Veo 2

با وجود پیشرفت های چشمگیر، این مدل هنوز با برخی چالش ها روبه رو است:

  • هماهنگی طولانی مدت با درخواست های پیچیده: این مدل نمی تواند به صورت کامل به درخواست های چندلایه و طولانی مدت پایبند بماند.
  • جزئیات ظریف و حرکات سریع: ایجاد جزئیات بسیار پیچیده یا شبیه سازی حرکات بسیار سریع همچنان جای پیشرفت دارد.
  • شخصیت پردازی: مدل در ایجاد چهره های واقعی تر یا حفظ ظاهر یکنواخت شخصیت ها در طول ویدیو با محدودیت هایی مواجه است.

کاربردها و آینده Veo 2

گوگل قصد دارد از Veo 2 در پلتفرم های مختلف خود استفاده کند. این مدل به زودی در Vertex AI، پلتفرم توسعه دهندگان گوگل، در دسترس قرار خواهد گرفت و در ماه های آینده قابلیت های بیشتری به آن افزوده می شود.

تبلیغ گوگل

تدابیر امنیتی و جلوگیری از سوءاستفاده

برای جلوگیری از سوءاستفاده از این فناوری در تولید دیپ فیک ها، DeepMind از فناوری واترمارک اختصاصی خود به نام SynthID استفاده می کند. این واترمارک به صورت نامرئی در فریم های ویدیو تعبیه می شود، اما مانند تمام فناوری های واترمارک، کاملاً نفوذناپذیر نیست.

ارتقا مدل تصویری Imagen 3

علاوه بر Veo 2، Google DeepMind از نسخه جدید مدل تولید تصویر خود، Imagen 3، رونمایی کرده است. این مدل که برای کاربران ابزار ImageFX در دسترس است، توانایی های بیشتری در ایجاد تصاویر روشن تر، دقیق تر و با جزئیات بیشتر دارد.

کاربران همچنین می توانند با استفاده از رابط کاربری جدید ImageFX، از پیشنهادات هوشمند برای ایجاد تصاویر متنوع و خلاقانه استفاده کنند.

مطالعه بیشتر:  Gemini Live اکنون برای همه رایگان است

نتیجه گیری

Google DeepMind با معرفی Veo 2 قدمی بلند در عرصه تولید ویدیوهای هوش مصنوعی برداشته است. این فناوری نوآورانه، با قابلیت های بی نظیر و پتانسیل گسترده، می تواند تحولی در حوزه تولید محتوای ویدیویی ایجاد کند. با این حال، چالش هایی همچون بهبود جزئیات ویدیو و افزایش هماهنگی با درخواست های پیچیده هنوز نیازمند کار بیشتر است.

بیشتر بخوانید:

روش های تماشای ویدیو در یوتیوب بدون تبلیغ | چگونگی حذف تبلیغات یوتیوب

معرفی ابزار ساخت متن ویدیو با هوش مصنوعی VEED

تبلیغ گوگل

مهشید عشوری

من مهشید عشوری، نویسنده و تولیدکننده محتوای جیمکس ادز و شیفته دنیای سئو هستم. عاشق نوشتن درمورد یوتیوب، درآمد دلاری و تبلیغات گوگلم. هدف من توی جیمکس نوشتن محتواهای به روزی هست که مسیر نقد درآمد یوتیوب و تبلیغ در گوگل رو برای شما هموار کنه

نظرات کاربران درباره پست 0 دیدگاه ثبت شده
نظرات خود را درباره این سرویس ثبت کنید

پرطرفدارترین مطالب این هفته

مشتریان شرکت تبلیغاتی جیمکس آشنا شوید

انتشار Gemini Deep Research در گوگل ورک اسپیس
انتشار Gemini Deep Research در گوگل ورک اسپیس

گوگل به تازگی خبر از انتشار Gemini Deep Research به سطح Gemini Advanced در Google Workspace می دهد. این ویژگی جدید برای کاربران Business Standard، Business Plus، Enterprise Standard و Enterprise Plus در دسترس خواهد بود....

امکان ساخت ویدیو با Gemini: ارتقاء هوش مصنوعی گوگل در تولید ویدیو
امکان ساخت ویدیو با Gemini: ارتقاء هوش مصنوعی گوگل در تولید ویدیو

گوگل در حال آزمایش ویژگی های جدید برای تولید ویدیو با هوش مصنوعی در اپلیکیشن جمنی (Gemini) خود است. این به این معناست که ممکن است به زودی کاربران جمنی قادر به تولید...

تحول بزرگ سیری: اپل در حال توسعه دستیار صوتی هوشمندتر با هوش مصنوعی
تحول بزرگ سیری: اپل در حال توسعه دستیار صوتی هوشمندتر با هوش مصنوعی

اپل، غول فناوری جهان، در تلاش است تا با یک تحول بزرگ، جایگاه خود را در رقابت هوش مصنوعی تقویت کند. بر اساس گزارش های منتشرشده، این شرکت در حال کار بر روی نسخه ای...