مدل Gemini محصول شرکت Google هست که دسامبر ۲۰۲۳ معرفی شد. این مدل در واقع نسل بعدی مدل PaLM 2 محسوب میشه و با تمرکز روی چند وجه بودن (multimodal) ساخته شده؛ یعنی میتونه همزمان با متن، تصویر، صدا و حتی ویدئو کار کنه. یکی از مهم ترین ویژگی های اکانت جمینای، توانایی پردازش و درک متن و تصویر، همراه با قابلیت تولید متن و کد است.
قابلیت / ویژگی | نسخه رایگان (Free) | نسخه پولی Pro (AI Pro) | نسخه پولی Ultra (AI Ultra) |
---|---|---|---|
مدل مورد استفاده | Gemini 2.5 Flash | Gemini 2.5 Pro | Gemini 2.5 Deep Think |
محدوده متنی (Context Window) | ۳۲,۰۰۰ توکن (حدود ۵۰ صفحه) | ۱,۰۰۰,۰۰۰ توکن (حدود ۱۵۰۰ صفحه یا ۳۰هزار خط کد) | ۱,۰۰۰,۰۰۰ توکن (با امکانات ویژه و پیشرفته) |
بارگذاری فایلها | محدود (متن، اسلاید، تصویر، ویدئو تا ۵ دقیقه) | پشتیبانی از فایلهای گسترده (Excel، CSV) و پوشههای کد | مشابه Pro |
بارگذاری ویدئو | تا ۵ دقیقه | تا ۱ ساعت + قابلیت تولید ویدئو (۳ کلیپ ۸ ثانیهای 720p در روز) | تولید ویدئو با کیفیت بالا (Veo 3) |
تاریخچه مکالمات | ندارد | دارد (امکان استفاده در گفتگوهای جدید) | دارد |
تحقیق عمیق (Deep Research) | محدود | گستردهتر | کامل و پیشرفته |
توضیحات صوتی (Audio Overviews) | محدود | گستردهتر | کامل و پیشرفته |
تولید تصویر | دارد | دارد (کیفیت بالاتر) | دارد |
تولید ویدئو | ندارد | دارد (محدود) | دارد (با کیفیت بالا) |
Google Workspace | ندارد | دارد (Gmail، Docs، Slides و...) | دارد |
فضای ذخیرهسازی | معمولی | ۲ ترابایت | ۳۰ ترابایت |
خدمات اضافی | ندارد | ندارد | YouTube Premium، Agent Mode، امکانات آزمایشی |
Veo 3 یک هوش مصنوعی پیشرفته در حوزه تولید ویدئو است که توانایی ساخت ویدئوهایی با کیفیت بسیار بالا، حتی در سطح سینمایی را دارد. یکی از ویژگیهای برجسته این فناوری، پشتیبانی از زبان فارسی است که امکان تولید ویدئو با متن و دستورهای فارسی را فراهم میکند. Veo 3 قابلیت تولید ویدئو همراه با صدا را دارد؛ بهعنوان نمونه، اگر از آن بخواهید ویدئویی از پرندگان در حال پرواز بسازد، میتواند نهتنها تصویر پرندگان را خلق کند، بلکه نوع پرنده و صدای آنها را نیز بهطور دقیق شبیهسازی کند.
مرحله اول: نوشتن پرامپت
ابتدا باید یک متن کوتاه و واضح بهعنوان پرامپت بنویسید.
مثال: «یک پسر در حال بازی فوتبال در کوچههای ایران». این متن همان دستوری است که Veo 3 بر اساس آن ویدئو تولید میکند.
مرحله دوم: درک دستور توسط هوش مصنوعی
Veo 3 محتوای پرامپت را پردازش کرده و بهطور کامل متوجه میشود چه چیزی از آن خواستهاید.
مرحله سوم: تولید تصاویر اولیه
هوش مصنوعی بر اساس متن دریافتی، فریمها یا تصاویر اولیهای را میسازد. این تصاویر در ابتدا ثابت هستند، مانند صحنههای جداگانه.
مرحله چهارم: ایجاد ویدئو نهایی
Veo 3 با اتصال هوشمندانه این فریمها، یک ویدئو روان و منسجم تولید میکند.
در پایان، شما میتوانید ویدئو را مستقیماً ویرایش کنید (با استفاده از Gemini) یا آن را دانلود کرده و بهصورت شخصیسازیشده ادیت کنید.
نوع آزمون رایگان | توضیحات |
---|---|
۳۰ روز رایگان برای همه | کاربران میتوانند پس از ثبتنام در پلن AI Pro، از ۳۰ روز اول بهصورت رایگان استفاده کنند؛ بدون نیاز به پرداخت در این مدت |
۱۲ ماه رایگان برای دانشجویان | شامل دسترسی کامل به ویژگیهای Pro از جمله Veo 3، Deep Research و فضای ذخیرهسازی ۲ ترابایتی خواهد بود؛ مشروط به واجد شرایط بودن و ثبتنام تا مهلت تعیینشده. |
در صفحه رسمی اشتراکهای گوگل برای Gemini ذکر شده که پس از انتخاب پلن Google AI Pro، یک ماه اول رایگان است. این شامل دسترسی به ویژگیهایی مانند مدل 2.5 Pro، Deep Research، تولید ویدیو با Veo 3 Fast و فضای ذخیرهسازی ۲ ترابایتی است. همچنین برای دانشجویان مجاز در برخی کشور ها، پلن پرو برای یک سال کامل بهصورت رایگان ارائه میشود.
ورود به حساب گوگل : وارد حساب Google شوید. دقت بکنید وارد حسابی بشوید که در آن پلن پرو فعال شده باشد
انتخاب مدل Veo 3 در رابط کاربری: مدلی که مد نظر شماست برای استفاده را انتخاب بکنید برای مثال: Veo2 یا Veo3
استفاده از ابزار Video در Gemini : در نسخه وب شما میتوانید با کلیک روی گزینه Video کنارباکس پرامپت را انتخاب تصویر مد نظر آپلود و پرامپت را ارسال بکنید تا ویدیو شما ساخته بشود.
دریافت ویدیو نهایی: بعد از دریافت پرامپت و پردازش تصویر منتظر ساخت ویدیو باشیدو پایان ویدیو دانلود و استفاده بکنید.
جمینای قابلیت فعالسازی و استفاده روی تلفن همراه را دارد. این اپلیکیشن بهصورت پیشفرض بر روی برخی گوشیهای پیشرفته نصب است، با این حال کاربران میتوانند آن را از فروشگاههای رسمی نیز دریافت و نصب کنند. لازم به ذکر است که سیستمعامل مورد نیاز برای اجرای جمینای، اندروید نسخه ۱۰ به بالا میباشد.
در بالای محیط کاربری، گزینهای با عنوان Ask Gemini وجود دارد که از طریق آن میتوانید پرسش خود را مستقیماً وارد کنید.
در پایین صفحه، کنار علامت Gemini، نسخهی فعال برنامه نمایش داده میشود. بهعنوان نمونه، اگر عدد 2.5 درج شده باشد، نشاندهندهی استفاده از نسخهی Gemini 2.5 است.
این دکمه برای ارسال پرسش یا دستور بهصورت صوتی مورد استفاده قرار میگیرد.
از طریق این گزینه میتوانید فایل دلخواه خود (متن، تصویر یا سایر فرمتها) را بارگذاری کنید تا توسط جمینای پردازش شود.
«بله، استفاده از Veo 3 میتواند باعث افزایش بازدید در شبکه های اجتماعی شود. دلیل اصلی آن، امکان بهکارگیری خلاقیت در پرامپت نویسی است. شما میتوانید با تولید ویدئوهای خلاقانه و متفاوت، محتوایی جذاب و منحصربهفرد ارائه دهید و در نتیجه توجه و بازدید بیشتری از مخاطبان دریافت کنید.
در دنیای امروز که بسیاری از فعالیتها با هوش مصنوعی انجام میشود، یادگیری ساخت ویدئو با استفاده از فناوریهای هوشمند اهمیت ویژهای دارد. دلیل این موضوع روشن است؛ هرچه بهتر بتوانیم با نسل جدید ابزارهای هوش مصنوعی همراه شویم، فرصتهای بیشتری برای پیشرفت خواهیم داشت. اکنون با معرفی فناوری Veo 3 در بستر جمینای توسط گوگل، صنعت تولید ویدئو دچار تحول بزرگی شده است. این ابزار با ارائه بهترین افکتها و کیفیت سینمایی، سطح تازهای از خلاقیت و نوآوری را به کاربران عرضه میکند.نکتهی ارزشمند دیگر این است که جمینای از زبان فارسی نیز پشتیبانی میکند؛ موضوعی که باعث خوشحالی و سهولت استفادهی کاربران فارسیزبان شده.
منبع: beiten.ir