آموزش مدل‌های هوش مصنوعی بدون کپی‌رایت دشوار است

خبرگزاری مهر شنبه 17 خرداد 1404 - 13:26
محققان مدعی شده اند که می‌توان مدل‌های هوش مصنوعی را بدون استفاده از محتوایی که تحت قانون کپی‌رایت قرار دارد توسعه داد، اما انجام این کار دشوار است.

به گزارش خبرگزاری مهر به نقل از انگجت، شرکت های هوش مصنوعی مدعی هستند ابزارهایشان بدون دریافت آموزش از محتوای شامل قانون کپی رایت نمی تواند وجود داشته باشد. اکنون مشخص شده آموزش این مدل ها بدون چنین محتوایی ممکن اما کار سختی است.

محققان هوش مصنوعی برای اثبات این امر یک مدل جدید را آموزش دادند که قدرت کمتری دارد اما اخلاق مدارتر است زیرا مخزن داده ای که مدل زبانی بزرگ از آن استفاده می کند فقط مربوط به دامنه های عمومی و محتوایی است که به طور آزاد در دسترس هستند.

این تحقیق با همکاری بین ۱۴ موسسه مختلف انجام شد. مولفان از دانشگاه هایی مانندام آی تی، کارنگی ملون و دانشگاه تورنتو انجام شده است. موسسات ناسودآوری مانند وکتو انستیتو و آلن انستیتو برای هوش مصنوعی نیز به پژوهش کمک کردند.

این گروه یک مخزن داده اخلاق مدار هشت ترابایتی ساختند. میان داده ها ۱۳۰ هزار کتاب موجود در کتابخانه کنگره آمریکا نیز وجود داشت. محققان بعدا یک مدل زبانی بزرگ با هفت میلیارد پارامتر را با این داده ها آموزش دادند. عملکرد مدل حاصل به خوبی مدل هوش مصنوعی Llama۲-۷B متا در سال ۲۰۲۳، بود. محققان بنچمارک هایی که برای مقایسه نتایج به کار بردند را منتشر نکردند.

البته قدرت عملکرد آن که به اندازه یک مدل مربوط به دو سال قبل بود، تنها نکته منفی مدل توسعه یافته نبود. فرایند در کنار هم قرار دادن اجزا نیز سخت بود. ماشین ها قادر به خواندن بخش اعظم داده ها نبودند، بنابراین انسان‌ها مجبور بودند آنها را غربال کنند. استلا بیدرمن، یکی ازمولفان پژوهش می گوید: «اما تمام مطالب ما در پایان روز به صورت دستی حاشیه‌نویسی و توسط افراد بررسی می‌شد و این واقعاً سخت است.» درک جزئیات حقوقی نیز این فرایند را مشکل کرد.

منبع خبر "خبرگزاری مهر" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.