گروهی از نویسندگان با شکایت از انتروپیک (Anthropic) این استارتاپ حوزه هوش مصنوعی را به استفاده غیرقانونی از کتابها برای آموزش مدلهای خود متهم کردند. در این شکایت گفته شده که انتروپیک «با سرقت صدها هزار کتاب دارای حق چاپ، یک کسبوکار چند میلیارد دلاری ایجاد کرده است».
براساس گزارش رویترز، نویسندگان در دادخواست خود میگویند که Anthropic از مجموعه دادههای متنباز گستردهای با نام «The Pile» برای آموزش خانواده چتباتهای هوش مصنوعی کلاود (Claude) استفاده کرده است. دادههای مذکور شامل مجموعهای عظیم از کتابهای الکترونیک غیرقانونی با نام Books3 میشود که آثاری ازجمله از «استیون کینگ» و صدها نویسنده دیگر در آن وجود دارد.
انتروپیک اوایل این ماه به نشریه Vox اعلام کرده بود که از The Pile برای آموزش مدلهای کلاود خود استفاده کرده است.

در متن این شکایت آمده است:
«مشخص است که انتروپیک نسخههایی از The Pile و Books3 را دانلود و تکثیر کرده است، درحالیکه میدانسته این دادهها از مجموعهای از محتواهای دارای حق چاپ تشکیل شدهاند که از وبسایتهای غیرقانونی مانند Bibiliotik بهدست آمده است.»
این نویسندگان که نامهایی از جمله «آندریا بارتز»، نویسنده کتاب «ما هرگز اینجا نبودهایم» (We Were Never Here) و «چارلز گریبر»، نویسنده کتاب «پرستار خوب» (The Good Nurse) در بین آنها دیده میشود، از دادگاه خواستهاند که دادخواست دسته جمعی آنها را تأیید کند و همچنین انتروپیک را به پرداخت خسارت مجبور کند. بهعلاوه، از دادگاه خواسته شده که استفاده از مطالب دارای حق چاپ برای آموزش مدلهای هوش مصنوعی این استارتاپ متوقف شود.

سال گذشته، «مایک هاکبی»، فرماندار سابق آرکانزاس همراه با چند نویسنده، شکایت مشابهی را علیه متا، مایکروسافت و EleutherAI (مؤسسه غیرانتفاعی مسئول The Pile) تنظیم کرده بودند. در آن شکایت گفته شده بود که آنها بهطور غیرقانونی از این مجموعه برای آموزش مدلهای هوش مصنوعی استفاده کردهاند.
«جورج آر.آر. مارتین»، نویسنده کتابهای «نغمه یخ و آتش» (A Song of Ice and Fire) نیز همراه با چند نویسنده دیگر سال گذشته از OpenAI بهدلیل استفاده از محتواهای دارای کپیرایت خود شکایت کرده بودند.