گوگل با معرفی دو مدل هوش مصنوعی قدرتمند، تحول بزرگی در زمینه تولید محتوای بصری ایجاد کرد. این شرکت از مدل تصویرساز Nano Banana 2 Lite رونمایی کرده که سرعت و قیمت مقرونبهصرفهای دارد. همچنین گوگل با عرضه گسترده مدل Gemini Omni Flash، امکان تولید و ویرایش حرفهای ویدیوها را در اختیار کاربران قرار داده است.
به گفته گوگل، مدل نانو بنانا ۲ لایت برای پروژههایی طراحی شده است که به سرعت بالا و تولید انبوه تصویر نیاز دارند. به ادعای این شرکت، این مدل با کمترین میزان تأخیر میتواند تصاویر باکیفیتی را فقط در چهار ثانیه ایجاد کند. این سرعت خیرهکننده، نانو بنانا ۲ لایت را به ابزاری ایدهآل برای ساخت نمونههای اولیه و ایدهپردازی سریع تبدیل میکند. در کنار سرعت بالا، هزینه استفاده از این ابزار نیز بسیار اقتصادی است و کاربران برای تولید هر هزار تصویر فقط باید ۰.۰۳۴ دلار پرداخت کنند.

گوگل این مدل را به عنوان جایگزین رسمی نسخه اولیه نانو بنانا معرفی میکند و به توسعهدهندگان پیشنهاد میدهد تا برای بهرهمندی از کیفیت بهتر و هزینه کمتر، سیستمهای خود را به این نسخه ارتقا دهند. کاربران اکنون میتوانند از طریق پلتفرمهایی مانند Google AI Studio و API جمینای به این هوش مصنوعی دسترسی پیدا کنند.

در ویدیو پایین میتوانید سرعت و قیمت مدل نانو بنانا ۲ لایت را با نانو بنانا ۲ مقایسه کنید:
در کنار معرفی ابزار تصویرساز، گوگل دسترسی کاربران را به مدل ویدیویی جمینای امنی فلش گسترش داد. این پلتفرم که پیش از این در مراسم Google I/O معرفی شده بود، اکنون با قیمت رقابتی ۰.۱۰ دلار به ازای هر ثانیه خروجی ویدیو در دسترس قرار دارد.
در ویدیو پایین میتوانید ببینید فردی ویدیوهای خود را با این هوش مصنوعی تغییر میدهد و به قول گوگل با هوش مصنوعی «شعبدهبازی» میکند:
یکی از جذابترین قابلیتهای این مدل، امکان ویرایش محاورهای ویدیوهاست؛ به این معنی که کاربران میتوانند فقط با استفاده از دستورات متنی ساده، تغییرات دلخواه خود را روی ویدیوها اعمال کنند. امنی فلش همچنین از دانش عمومی هوش مصنوعی جمینای مانند مفاهیم زیستشناسی، تاریخ و منطق روایی برای ساخت ویدیوهای واقعگرایانه بهره میبرد و میتواند متن و گرافیک را به صورت دقیق با حرکات درون ویدیو هماهنگ کند.
با وجود این قابلیتهای هیجانانگیز، سیستم جمینای امنی فلش درحالحاضر محدودیتهایی دارد. کاربران در این نسخه پیشنمایش تنها میتوانند ویدیوهای ۱۰ ثانیهای تولید کنند، اما گوگل وعده داده است که امکان ساخت ویدیوهای طولانیتر را بهزودی فراهم میکند.

گوگل معتقد است که قدرت واقعی این ابزارها زمانی مشخص میشود که توسعهدهندگان آنها را در کنار یکدیگر قرار دهند. کاربران میتوانند ابتدا با سرعت بالا یک تصویر را در نانو بنانا ۲ لایت تولید کنند و سپس آن را به عنوان یک فایل مرجع به جمینای امنی فلش بدهند تا یک ویدیوی متحرک و جذاب تحویل بگیرند.
تمامی خروجیهای این پلتفرمها به فناوری واترمارک نامرئی SynthID مجهز هستند. این فناوری به کاربران و سیستمهای مختلف اجازه میدهد تا به راحتی ماهیت مصنوعیبودن تصاویر و ویدیوها را شناسایی کنند و از انتشار اطلاعات نادرست در فضای مجازی جلوگیری میکند.