بایدو مدل ERNIE 5 را معرفی کرد؛ رقیب قدرتمند GPT-5 و جمینای

دیجیاتو جمعه 23 آبان 1404 - 14:37
این مدل در بنچمارک‌های درک اسناد و نمودارها، GPT-5 و Gemini 2.5 را شکست داد. The post بایدو مدل ERNIE 5 را معرفی کرد؛ رقیب قدرتمند GPT-5 و جمینای appeared first on دیجیاتو.

تنها یک روز پس از آنکه OpenAI مدل GPT-5.1 را منتشر کرد، شرکت چینی بایدو از مدل هوش مصنوعی جدیدش با نام ERNIE 5.0 رونمایی کرد.

ERNIE 5.0 یک مدل همه‌وجهی و انحصاری است؛ یعنی این مدل برای پردازش و تولید همزمان محتوا در چهار وجه متن، تصویر، صدا و ویدیو طراحی شده است. همچنین برخلاف مدل اخیر این شرکت یعنی ERNIE-4.5-VL که به‌صورت متن‌باز عرضه شد، ERNIE 5.0 انحصاری است و فقط از طریق وب‌سایت ERNIE Bot و پلتفرم ابری Qianfan (از طریق API) در دسترس خواهد بود. بایدو همچنین نسخه دیگری به نام ERNIE 5.0 Preview 1022 را معرفی کرده که به‌طور خاص برای کارهای سنگین متنی بهینه‌سازی شده است.

رقابت مدل جدید ERNIE 5.0 با GPT-5

براساس بنچمارک‌های بایدو، ERNIE 5.0 در طیف وسیعی از کارها عملکردی برابر یا حتی بهتر از GPT-5-High (مدل رده‌بالای OpenAI) و Gemini 2.5 Pro داشته است. برگ برنده اصلی بایدو، در حوزه‌هایی است که برای کسب‌وکارها اهمیت اساسی دارند: این مدل در بنچمارک‌های OCRBench (تشخیص نوری کاراکترها) و DocVQA (پاسخ به سؤال از روی اسناد) توانسته است رقبای آمریکایی خود را شکست دهد.

مدل جدید ERNIE 5.0 بایدو

همچنین در بنچمارک ChartQA، مدل بایدو در استدلال و درک داده‌های ساختاریافته از نمودارها، برتری نشان داده است. بایدو ادعا می‌کند این توانایی‌ها ERNIE 5.0 را به گزینه‌ای ایده‌آل برای پردازش خودکار اسناد و تحلیل‌های مالی تبدیل می‌کند.

مدل جدید ERNIE 5.0 بایدو

در بخش تولید تصویر این مدل با Veo3 گوگل برابری کرده یا از آن پیشی گرفته است. در کارهای صوتی و زبانی نیز نتایج رقابتی اعلام شده‌اند، هرچند تمرکز اصلی روی درک بصری و اسناد بوده است.

بایدو ERNIE 5.0 را به‌عنوان یک مدل پریمیوم قیمت‌گذاری کرده که به‌طور قابل‌توجهی گران‌تر از نسخه‌های قبلی مانند ERNIE 4.5 Turbo است. بااین‌حال، هزینه آن در مقایسه با رقبای اصلی آمریکایی، همچنان بسیار رقابتی و ارزان‌تر به نظر می‌رسد.

در جدول زیر، هزینه استفاده (به‌ازای هر ۱ میلیون توکن) مقایسه شده است:

مدلهزینه ورودی (۱ میلیون توکن)هزینه خروجی (۱ میلیون توکن)
ERNIE 5.0 (Baidu)$0.85$3.40
GPT-5.1 (OpenAI)$1.25$10.00
Gemini 2.5 Pro (Google)$1.25 (تا 200k)$10.00 (تا 200k)
Claude Opus 4.1 (Anthropic)$15.00$75.00
ERNIE 4.5 Turbo (Baidu)$0.11$0.45

رونمایی از این مدل، بخشی از یک استراتژی بزرگ‌تر بایدو بود. این غول چینی هم‌زمان محصولات دیگری مانند MeDo (پلتفرم ساخت اپلیکیشن بدون کد) و Oreate را در سطح جهانی عرضه کرده و سرویس تاکسی خودران Apollo Go نیز را به ۲۲ شهر گسترش داده است.

منبع خبر "دیجیاتو" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.