بسیاری از ما در خواب کابوس ناتوانی در صحبتکردن یا حرکتکردن را تجربه کردهایم؛ اما برای میلیونها بیمار مبتلا به اختلالات عصبی، این کابوس یک واقعیت تلخ روزمره است. اکنون متا با معرفی نسخه دوم سیستم هوش مصنوعی Brain2Qwerty v2، گام بلندی برای پایاندادن به این سکوت تحمیلی برداشته است. این سیستم هوش مصنوعی میتواند امواج پیچیده مغزی را بدون نیاز به هیچگونه جراحی تهاجمی، به جملات منسجم و قابلفهم تبدیل کند و امید تازهای برای بیماران فلج حرکتی باشد.
متا در بیانیه رسمی خود گفت این پژوهش پتانسیل ایجاد تغییرات واقعی در زندگی افرادی را دارد که به دلیل ضایعات مغزی، توانایی برقراری ارتباط را از دست دادهاند. این سیستم نوین، آیندهای را ترسیم میکند که در آن بیماران مبتلا به سندروم قفلشدگی، بیماری ALS و سایر اختلالات تخریبکننده عصبی، برای صحبتکردن دیگر نیازی به جراحیهای خطرناک، گرانقیمت و کاشت تراشه در مغز ندارند.
متا در راستای حمایت از جریان تحقیقات علمی، کدهای پایه نسخه دوم و همچنین نسخه پیشین این سیستم را به صورت متنباز منتشر کرده است. متا با این اقدام قصد دارد دانشمندان سراسر جهان را برای شناسایی، تشخیص و درمان سریعتر اختلالات عصبی یاری کند و روند پیشرفتهای پزشکی را با اشتراکگذاری دادهها شتاب بدهد.
محققان فرایند آموزش این مدل جدید را در مرکز شناخت، مغز و زبان باسک در شهر سنسباستین اسپانیا انجام دادند. آنها از ۹ داوطلب سالم در بازه سنی ۲۵ تا ۵۶ سال خواستند تا در طول ده جلسه، بیش از ۲۵۰۰ جمله را تایپ کنند. در طول این جلسات، دستگاه MEG که میدانهای الکتریکی بسیار کوچک ناشی از فعالیت نورونها را میسنجد، فعالیت مغزی آنها را به دقت ثبت کرد. ترکیب این جملات تایپشده و اسکنهای مغزی، دادههای خام و ارزشمندی را برای آموزش سیستم فراهم آورد.

نتایج این آزمایشها نشان داد سیستم جدید در موفقترین اجرای خود توانست به دقت کلمهای ۷۸ درصد دست پیدا کند که پیشرفتی خیرهکننده نسبت به دقت ۴۸ درصدی نسخه اول محسوب میشود. رسیدن به این عدد نشان میدهد که در بیش از نیمی از جملات رمزگشاییشده، حداکثر فقط یک کلمه اشتباه وجود داشته است. پژوهشگران همچنین دریافتند که با افزایش حجم دادههای آموزشی، توانایی سیستم برای رمزگشایی نیز افزایش مییابد.

مهندسان برای دستیابی به این دقت، از همان فناوری تشخیص الگو که در چتباتهایی مانند ChatGPT و Llama وجود دارد، استفاده کردند. فرایند رمزگشایی در این سیستم سه مرحله اصلی دارد. ابتدا یک هوش مصنوعی امواج مغزی ثبتشده را به توکنهایی از حروف مجزا تبدیل میکند. سپس یک سیستم ترازکننده (Aligner) این حروف را در قالب کلمات مرتب میکند. در مرحله آخر، یک مدل زبانی بزرگ این کلمات پراکنده را به جملاتی منسجم و معنادار تغییر میدهد.