تازه‌های تکنولوژی:

رونمایی گوگل از مدل نانو بنانا ۲ لایت؛ جمینای Omni Flash منتشر شد [تماشا کنید]

دیجیاتو چهارشنبه 10 تیر 1405 - 09:46

مدل تصویرساز Nano Banana 2 Lite سرعت و قیمت بسیار مقرون‌به‌صرفه‌ای دارد. The post رونمایی گوگل از مدل نانو بنانا ۲ لایت؛ جمینای Omni Flash منتشر شد [تماشا کنید] appeared first on دیجیاتو.

گوگل با معرفی دو مدل هوش مصنوعی قدرتمند، تحول بزرگی در زمینه تولید محتوای بصری ایجاد کرد. این شرکت از مدل تصویرساز Nano Banana 2 Lite رونمایی کرده که سرعت و قیمت مقرون‌به‌صرفه‌ای دارد. همچنین گوگل با عرضه گسترده مدل Gemini Omni Flash، امکان تولید و ویرایش حرفه‌ای ویدیوها را در اختیار کاربران قرار داده است.

به گفته گوگل، مدل نانو بنانا ۲ لایت برای پروژه‌هایی طراحی شده است که به سرعت بالا و تولید انبوه تصویر نیاز دارند. به ادعای این شرکت، این مدل با کمترین میزان تأخیر می‌تواند تصاویر باکیفیتی را فقط در چهار ثانیه ایجاد کند. این سرعت خیره‌کننده، نانو بنانا ۲ لایت را به ابزاری ایده‌آل برای ساخت نمونه‌های اولیه و ایده‌پردازی سریع تبدیل می‌کند. در کنار سرعت بالا، هزینه استفاده از این ابزار نیز بسیار اقتصادی است و کاربران برای تولید هر هزار تصویر فقط باید ۰.۰۳۴ دلار پرداخت کنند.

گوگل این مدل را به عنوان جایگزین رسمی نسخه اولیه نانو بنانا معرفی می‌کند و به توسعه‌دهندگان پیشنهاد می‌دهد تا برای بهره‌مندی از کیفیت بهتر و هزینه کمتر، سیستم‌های خود را به این نسخه ارتقا دهند. کاربران ‌اکنون می‌توانند از طریق پلتفرم‌هایی مانند Google AI Studio و API جمینای به این هوش مصنوعی دسترسی پیدا کنند.

در ویدیو پایین می‌توانید سرعت و قیمت مدل نانو بنانا ۲ لایت را با نانو بنانا ۲ مقایسه کنید:

معرفی مدل‌های نانو بنانا ۲ لایت و Gemini Omni Flash

در کنار معرفی ابزار تصویرساز، گوگل دسترسی کاربران را به مدل ویدیویی جمینای امنی فلش گسترش داد. این پلتفرم که پیش از این در مراسم Google I/O معرفی شده بود، اکنون با قیمت رقابتی ۰.۱۰ دلار به ازای هر ثانیه خروجی ویدیو در دسترس قرار دارد.

در ویدیو پایین می‌توانید ببینید فردی ویدیوهای خود را با این هوش مصنوعی تغییر می‌دهد و به قول گوگل با هوش مصنوعی «شعبده‌بازی» می‌کند:

یکی از جذاب‌ترین قابلیت‌های این مدل، امکان ویرایش محاوره‌ای ویدیوهاست؛ به این معنی که کاربران می‌توانند فقط با استفاده از دستورات متنی ساده، تغییرات دلخواه خود را روی ویدیوها اعمال کنند. امنی فلش همچنین از دانش عمومی هوش مصنوعی جمینای مانند مفاهیم زیست‌شناسی، تاریخ و منطق روایی برای ساخت ویدیوهای واقع‌گرایانه بهره می‌برد و می‌تواند متن و گرافیک را به صورت دقیق با حرکات درون ویدیو هماهنگ کند.

با وجود این قابلیت‌های هیجان‌انگیز، سیستم جمینای امنی فلش درحال‌حاضر محدودیت‌هایی دارد. کاربران در این نسخه پیش‌نمایش تنها می‌توانند ویدیوهای ۱۰ ثانیه‌ای تولید کنند، اما گوگل وعده داده است که امکان ساخت ویدیوهای طولانی‌تر را به‌زودی فراهم می‌کند.

گوگل معتقد است که قدرت واقعی این ابزارها زمانی مشخص می‌شود که توسعه‌دهندگان آن‌ها را در کنار یکدیگر قرار دهند. کاربران می‌توانند ابتدا با سرعت بالا یک تصویر را در نانو بنانا ۲ لایت تولید کنند و سپس آن را به عنوان یک فایل مرجع به جمینای امنی فلش بدهند تا یک ویدیوی متحرک و جذاب تحویل بگیرند.

تمامی خروجی‌های این پلتفرم‌ها به فناوری واترمارک نامرئی SynthID مجهز هستند. این فناوری به کاربران و سیستم‌های مختلف اجازه می‌دهد تا به راحتی ماهیت مصنوعی‌بودن تصاویر و ویدیوها را شناسایی کنند و از انتشار اطلاعات نادرست در فضای مجازی جلوگیری می‌کند.

مشاهده متن کامل خبر در "دیجیاتو"