تازه‌های تکنولوژی:

ویژگی‌های صوتی جدید به API «اوپن‌ای‌آی» وارد می‌شوند

بیتوته دوشنبه 08 تیر 1405 - 16:03

ویژگی‌های صوتی جدید به API «اوپن‌ای‌آی» وارد می‌شوند

به گزارش ایسنا، شرکت «اوپن‌ای‌آی»(OpenAI) روز پنجشنبه اعلام کرد که API آن شامل تعدادی ویژگی جدید هوش صوتی خواهد بود و این ویژگی‌های جدید برای کمک به توسعه‌دهندگان در ایجاد اپلیکیشن‌هایی طراحی شده‌اند که می‌توانند با کاربران صحبت کنند، رونویسی کنند و گفت‌وگوها را ترجمه کنند.

به نقل از تک‌کرانچ، مدل جدید «جی‌پی‌تی-ریل‌تایم-۲»(GPT‑Realtime‑2) این شرکت، مدل صوتی دیگری است که برای ایجاد یک شبیه‌سازی صوتی واقع‌گرایانه برای گفت‌وگو با کاربران ساخته شده است. این مدل برخلاف مدل پیشین خود (GPT-Realtime-1.5)، با استدلال سطح GPT‑5 ساخته شده که اوپن‌ای‌آی می‌گوید برای رسیدگی به درخواست‌های پیچیده‌تر کاربران ایجاد شده است.

همچنین، اوپن‌ای‌آی در حال راه‌اندازی ویژگی «جی‌پی‌تی-ریل‌تایم-ترنسلیت»(GPT‑Realtime‑Translate) است که برای ارائه خدمات ترجمه در لحظه طراحی شده و از نظر گفت‌وگو با کاربر همگام است. این ویژگی شامل بیش از ۷۰ زبان ورودی - زبان‌هایی که می‌تواند درک کند - و ۱۳ زبان خروجی - زبان‌هایی که به گوینده منتقل می‌کند - است.

اوپن‌ای‌آی یک قابلیت رونویسی جدید به نام «جی‌پی‌تی-ریل‌تایم-ویسپر»(GPT-Realtime-Whisper) را نیز راه‌اندازی کرده است که امکان تبدیل گفتار به متن زنده را به کاربران می‌دهد.

این شرکت در توضیح ویژگی‌های جدید نوشت: مدل‌هایی که ما در حال راه‌اندازی آنها هستیم، در کنار یکدیگر صدا را به صورت در لحظه از تماس و پاسخ ساده به سمت رابط‌های صوتی سوق می‌دهند که واقعاً می‌توانند کارآمد باشند، گوش دهند، استدلال کنند، ترجمه کنند، رونویسی کنند و هم‌زمان با پیشروی گفت‌وگو اقدام کنند.

این به‌روزرسانی‌ها برای شرکت‌هایی سودمند خواهند بود که می‌خواهند قابلیت‌های خدمات مشتریان را گسترش دهند. با وجود این، اوپن‌ای‌آی خاطرنشان کرد که ویژگی‌های جدید آن به طیف گسترده‌ای از حوزه‌ها از جمله آموزش، رسانه، رویدادها و پلتفرم‌های خالقان محتوا و موارد دیگر نیز کمک خواهند کرد.

اگرچه این ویژگی‌ها از دیدگاه سازمانی سودمند به نظر می‌رسند اما می‌توانند مورد سوءاستفاده قرار بگیرند. اوپن‌ای‌آی اعلام کرده است که برای جلوگیری از سوءاستفاده از ویژگی‌های جدید خود برای ایجاد هرزنامه، کلاهبرداری یا سایر انواع سوءاستفاده آنلاین، محافظ‌هایی ساخته است. این شرکت اعلام کرد که محرک‌های خاصی در سیستم تعبیه شده‌اند تا در صورت تشخیص نقض دستورالعمل‌های محتوای مضر بتوانند گفت‌وگو را متوقف کنند.

مشاهده متن کامل خبر در "بیتوته"