هوش مصنوعی Grok-1.5 Vision معرفی شد؛ رقیب GPT-4V در درک تصاویر و نمودارها

دیجیاتوشنبه 25 فروردین 1403 - 13:03
Grok-1.5 ویژن به‌زودی برای افراد منتخب و برخی از کاربران فعلی چت‌بات متعلق به xAI در دسترس قرار می‌گیرد. The post هوش مصنوعی Grok-1.5 Vision معرفی شد؛ رقیب GPT-4V در درک تصاویر و نمودارها appeared first on دیجیاتو.

مدتی پیش استارتاپ هوش مصنوعی «ایلان ماسک» یعنی xAI نسخه جدید چت‌بات خود Grok-1.5 را معرفی کرد. حالا در ادامه رقابت این شرکت با OpenAI، مدل چندوجهی Grok-1.5 Vision یا Grok-1.5V رونمایی شد. این هوش مصنوعی اکنون علاوه‌بر آنکه می‌تواند متن را درک کند، قادر به پردازش نمودار، اسکرین‌شات‌ و تصاویر گوناگون است.

براساس اعلام xAI، نسخه Grok-1.5V می‌تواند با مدل‌های چندوجهی پیشرفته دیگر در بخش‌هایی مثل استدلال چند رشته‌ای، درک نمودارهای علمی، چارت‌ها و تصاویر رقابت کند. Grok-1.5 ویژن به‌زودی برای افراد منتخب و برخی از کاربران فعلی این چت‌بات در دسترس خواهد بود.

Grok ویژن با قابلیت پردازش داده‌های تصویری و چندوجهی

xAI نسخه چندوجهی Grok را در هفت بنچمارک مختلف با دیگر رقبا مانند GPT-4V مقایسه کرده است که در برخی از آن‌ها این مدل برتری قابل‌توجهی را به‌ثبت رسانده است. خواندن متن در تصویر، فهم مسائل ریاضی، تبدیل فلوچارت به کد پایتون، تولید یک داستان از نقاشی و تبدیل جدول به فرمت فایل CSV از قابلیت‌های جدید نسخه ویژن Grok است.

مقایسه Grok-1.5V با دیگر رقبا در بنچمارک‌های مختلف

xAI مدل چندوجهی خود را با رقیب‌هایی مثل GPT-4V ،Claude 3Sonnet و جمینای پرو 1.5 مقایسه کرده است و ادعا می‌کند که Grok-1.5V در بنچمارک RealWorldQA از رقبای خود بهتر عمل می‌کند؛ این بنچمارک جدید برای ارزیابی میزان درک دنیای واقعی ایجاد شده است.

بنچمارک RealWorldQA با استفاده از بیش از 700 تصویر به همراه پرسش‌وپاسخ برای هر مورد ایجاد شده است. در این تصاویر وسایل نقلیه گوناگون و اشیای دنیای واقعی وجود دارند. xAI این بنچمارک را با مجوز CC یا Creative Commons برای عموم منتشر می‌کند.

در اینجا Grok یک فلوچارت را که روی وایت‌برد کشیده شده است به کد پایتون تبدیل می‌کند.

شرکت هوش مصنوعی ایلان ماسک از زمانی که چت‌بات آن برای اولین‌بار در سال 2023 رونمایی شد، پیشرفت‌های زیادی داشته است و دائماً نیز تلاش می‌کند تا با OpenAI و دیگر شرکت‌های پیشتاز هوش مصنوعی رقابت کند. اما این چت‌بات در این مدت چندان بی‌حاشیه نیز نبوده است. اخیراً محققان دریافتند که چت‌بات Grok می‌تواند به کاربران درباره اقدامات مجرمانه اطلاعاتی بدهد.

بااین‌وجود، xAI به‌دنبال ساختن «هوش جامع مصنوعی سودمند» با قابلیت درک جهان است. این هدف نشان می‌دهد که در ماه‌های آینده به‌روزرسانی‌های قابل توجهی برای درک چندوجهی و قابلیت‌های هوش مصنوعی مولد به Grok خواهد آمد.

منبع خبر "دیجیاتو" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.