آخرین خبرها
خبرهای پربیننده
تقلید هوش مصنوعی از مغز انسان برای استفاده از مدل‌های زبانی
کد خبر: 291163 | تاریخ مخابره: ۱۴۰۰ چهارشنبه ۱ دي - 07:38

تقلید هوش مصنوعی از مغز انسان برای استفاده از مدل‌های زبانی

در سال 2019، مجله MIT Press Reader دو مصاحبه با «نوام چامسکی» و «استیون پینکر»؛ دونفر از برجسته‌ترین دانشمندان زبان‌شناسی و شناختی جهان منتشر کرد. وقتی موضوع یادگیری ماشین و سهم آن در علوم شناختی مطرح می‌شود، نظرات آن‌ها رنگ‌وبویی از شک و تردید و چیزی نزدیک به ناامیدی به‌خود می‌گیرد ... چامسکی می‌گوید؛ صرف‌نظر از ارزشی که احتمالاً برای ساخت وسایل مفید یا کاوش ویژگی‌های آن داشته باشد تقریباً از هر جنبه، بررسی اینکه چگونه یادگیری ماشینی به علم کمک می‌کند دشوار است؛ به‌ویژه در علم شناختی که فرآیندهای محاسباتی به‌کار گرفته شده است. درحالی‌که پینکر می‌گوید؛ خود علم شناختی در دهه 1990 تحت‌الشعاع علوم اعصاب و هوش مصنوعی دراین‌دهه قرار گرفت اما من فکر می‌کنم که این‌رشته‌ها باید بر عقیم بودن نظری خود غلبه کنند و با مطالعه شناخت دوباره ادغام شوند. به‌گزارش باشگاه خبرنگاران جوان؛ فیزیولوژی عصبی و یادگیری ماشینی هرکدام زمانی‌که به موانعی برمی‌خورند به هوش روشنگر می‌رسد. به‌هراندازه که درک ما از هوش مصنوعی و انسان افزایش می‌یابد، موقعیت‌هایی مانند این ممکن است به‌زودی خود را در شرایطی ناپایدار بیابند. درحالی‌که هوش مصنوعی هنوز به شناختی شبیه انسان دست پیدا نکرده است، شبکه‌های عصبی مصنوعی که پردازش زبان را تکرار می‌کنند به‌طرز شگفت‌آوری شبیه به آنچه در ساختار مغز انسان می‌بینیم به‌نظر می‌رسند. در ماه نوامبر، گروهی از محققان در MIT مطالعه‌ای را در مجموعه مقالات آکادمی ملی علوم منتشر کردند که نشان می‌دهد تحلیل روند یادگیری ماشینی می‌تواند پنجره‌ای به این مکانیسم‌های عملکرد شناختی بالاتر مغز ارائه دهد. شاید حتی نکته شگفت‌انگیزتر این مطالعه این‌موضوع باشد که هوش مصنوعی درحال‌تحول همگرا با طبیعت است بدون‌اینکه کسی برای انجام این‌کار برنامه‌ریزی کند. هوش مصنوعی بااستفاده‌از یادگیری ماشینی در سال‌های اخیر پیشرفت‌های چشمگیری به‌ویژه درزمینه تشخیص بصری داشته است. برای مثال اینستاگرام از هوش مصنوعی تشخیص تصویر برای توصیف عکس‌ها برای افراد کم‌بینا استفاده می‌کند، گوگل از آن برای عملکرد جستجوی عکس معکوس استفاده می‌کند و الگوریتم‌های تشخیص چهره شرکت‌هایی مانند Clearview AI به سازمان‌های مجری قانون کمک می‌کند تصاویر موجود در رسانه‌های اجتماعی را با تصاویر موجود در پایگاه‌های اطلاعاتی دولتی برای شناسایی افراد تحت‌تعقیب تطبیق دهند. جدای از بحث‌های مهم اخلاقی، این مکانیک نحوه عملکرد این الگوریتم‌ها است که می‌تواند عملکرد شناختی را واضح کند. با مقایسه فعالیت عصبی انسان داده‌های با مدل‌های یادگیری ماشینی شبکه عصبی مصنوعی با عملکردی مشابه محققان می‌توانند بینشی درمورداینکه کدام برنامه‌ها بهتر کار می‌کنند و کدام‌یک عملکرد ضعیف‌تری دارند، به‌دست آورند. این مطالعات و بررسی‌ها نشان می‌دهند که عملکرد سیستم مذکور شباهت زیادی به نحوه انجام همان‌کار توسط مغز دارد. مارتین شریمپ؛ اولین نویسنده مطالعه جدید MIT، در مصاحبه‌ای با Interesting Engineering توضیح داد؛ ما در مدل‌سازی نواحی حسی مغز به‌ویژه در بینایی موفقیت‌هایی داشته‌ایم. شریمپ دانشجوی دکترای دپارتمان مغز و علوم شناختی MIT، این مقاله را با Joshua Tenenbaum؛ مدرس علوم شناختی محاسباتی در MIT و یکی از اعضای آزمایشگاه هوش مصنوعی موسسه و Evelina Fedorenko؛ دانشیار علوم اعصاب در دانشگاه، نوشتند. در‌پی این موفقیت‌ها، مارتین درباره این‌موضوع کنجکاو شد که آیا می‌توان همان اصل را برای عملکردهای شناختی سطح بالاتر مانند پردازش زبان به کار برد یا خیر؟ شریمپ گفت؛ من پیشنهاد کردم که فقط به شبکه‌های عصبی موفق نگاه کنیم و ببینیم که آیا چیزی شبیه به مغز هستند یا خیر. شرط من این‌بودکه حداقل تاحدودی جواب بدهد. یافته‌ای که بلافاصله توجه مارتین را جلب می‌کند این‌است‌که برخی مدل‌ها داده‌های عصبی را به‌خوبی پیش‌بینی می‌کنند. به‌عبارتی، صرف‌نظرازاینکه یک مدل چقدر در انجام یک کار خوب بوده است، برخی‌ازآن‌ها به‌نظر شبیه مکانیک شناختی مغز برای پردازش زبان هستند. به‌طرز جالبی، تیم MIT مدل‌های GPT را به‌عنوان شبیه‌ترین مغز در گروهی که آن‌را بررسی کردند، شناسایی کردند. نمونه GPT یک مدل یادگیری‌ست که برای تولید انواع متن به‌زبان انسان آموزش ‌دیده است. این توسط‌Open AI (آزمایشگاه تحقیقاتی هوش مصنوعی تأسیس‌شده توسط ایلان ماسک) توسعه داده شد که در ژوئن امسال ابزار هوش مصنوعی جدیدی با قابلیت نوشتن کدهای کامپیوتری را معرفی کرد. تا همین اواخر، GPT-3، آخرین تکرار برنامه، تنها بزرگ‌ترین شبکه عصبی ایجاد شده با بیش از 175‌میلیارد پارامتر یادگیری ماشینی بود. این یافته می‌تواند دریچه بزرگی را به نحوه انجام مغز حداقل بخشی از عملکرد شناختی سطح بالاتر مانند پردازش زبان باز کند. مدل GPT طبق اصل پیش‌بینی کلمه بعدی در یک دنباله عمل می‌کند. مطابقت بسیارخوبی با داده‌های به‌دست‌آمده از اسکن‌های مغزی نشان می‌دهد که هرکاری‌که مغز با پردازش زبان انجام می‌دهد، پیش‌بینی جزء کلیدی آن است. شریمپ خاطرنشان می‌کند که در موقعیت‌هایی که متون و داستان‌های طولانی‌تر به آزمودنی‌ها نشان داده می‌شد، همه مدل‌های شبکه عصبی درمقایسه‌با نحوه امتیازدهی آن‌ها به متون کوتاه‌برد نسبتاً ضعیف عمل کردند. مارتین می‌گوید؛ تفسیرهای مختلفی برای این‌موضوع وجود دارد؛ اما تفسیر هیجان‌انگیزتر که با آنچه اکنون یادگیری ماشینی به‌صورت شهودی انجام می‌دهد همخوانی دارد این‌است‌که شاید این مدل‌ها واقعاً در شکل‌دهی نمایش‌های کوتاه‌برد مناسب خوب باشند اما هنگامی‌که شما زمینه‌های معنایی دارید که باید آن‌را جمع‌آوری کنید، شاید آن‌ها کوتاهی کنند. دومین یافته مهم این تیم چیزی را درمورد نحوه عملکرد شناخت ما درمورد زبان نشان می‌دهد زیرا آن‌ها وظایف زبانی مختلف را ازطریق ترکیبی از هشت معیار مختلف که شامل جنبه‌هایی مانند دستور زبان، قضاوت و درهم تنیدگی بودند، آزمایش کردند. مارتین می‌گوید؛ هیچ‌کدام از آن‌ها با هم مرتبط نبودند؛ بنابراین، حتی اگر این مدل‌ها این وظایف را به‌خوبی انجام دهند، این به‌هیچ‌وجه پیش‌بینی نمی‌کند که چقدر با مغز مطابقت دارند. این چیزی است که به‌نظر می‌رسد سیستم زبان ما برای انجام آن بهینه شده است. برای درک دقیق اینکه چرا برخی از مدل‌ها بیشتر از بقیه شبیه مغز هستند، به مطالعه بیشتری نیاز است. این تاحدودی به این واقعیت مربوط می‌شود که در یادگیری ماشینی، مدل‌های هوش مصنوعی می‌توانند چیزی شبیه جعبه‌سیاه باشند که در آن عملکردهای آن‌ها به‌قدری پیچیده است که حتی افرادی‌که آن‌ها را طراحی کرده‌اند ممکن است نتوانند درک کنند که چگونه متغیرهایی که وارد می‌شوند در آن مدل‌ها به یکدیگر مرتبط هستند. مارتین تصدیق می‌کند که تجزیه این متغیرها می‌تواند یک کار بزرگ باشد. او می‌گوید؛ برای مدل‌های جداگانه، ما هنوز نمی‌دانیم اگر یک لایه کمتر در شبکه عصبی یا واحدهای کمتر یا واحدهای بیشتری داشته باشیم، چه اتفاقی می‌افتد. سومین یافته اصلی این مطالعه و یکی‌ازآن‌ها که منحصربه‌فردترین یافته آن‌را به نظریه‌های شناخت مرتبط می‌کند این‌است‌که هرچه یک مدل هوش مصنوعی شبیه مغز باشد، بیشتر می‌تواند با رفتار انسان و زمان‌های مطالعه فردی آزمودنی‌ها مطابقت داشته باشد. کنار‌هم‌قراردادن تصویر، ترکیب غیرمنتظره‌ای از دانش علمی را نشان می‌دهد که مارتین از آن به‌عنوان «مثلث» یاد می‌کند. مدل‌هایی که از پیش‌بینی کلمه بعدی استفاده می‌کنند، نمرات مغز سوژه‌ها را منعکس می‌کنند که به‌نوبه‌خود می‌تواند برای پیش‌بینی رفتار انسان استفاده شود. مارتین می‌گوید؛ من فکر می‌کنم این مثلث بینش‌ها فوق‌العاده جالب است. ‌حال‌که از بینش و سایر زمینه‌ها درس‌هایی آموختیم، توانستیم همه این‌ها را در یک مطالعه جمع‌آوری کنیم. مدل‌هایی که در پیش‌بینی کلمه بعدی بهتر هستند، بهتر می‌توانند پاسخ‌های عصبی را در مغز انسان پیش‌بینی کنند و مدل‌هایی که پاسخ‌های عصبی را بهتر پیش‌بینی می‌کنند، بهتر می‌توانند رفتار را در قالب زمان‌های خودخوانی پیش‌بینی کنند. یکی از دلایلی که این مطالعه جذاب است این‌است‌که این بینش‌ها درمورد شناخت به‌طور هم‌زمان به‌نوعی «تکامل هوش مصنوعی» درحال‌وقوع اشاره می‌کند، تحولی که تا همین اواخر موردتوجه قرار نگرفته بود. مهم است که به‌خاطر داشته باشید که هیچ‌کس عمداً هیچ‌یک از این مدل‌ها را طوری برنامه‌ریزی نکرده است که مانند مغز عمل کنند اما درطول ساخت و ارتقای آن‌ها، به‌نظر می‌رسد که ما به فرآیندی شبیه فرآیندی که خود مغز را تولید می‌کند، برخورد کرده‌ایم و شاید ازاین‌راه بتوانیم به افرادی‌که مشکلات درک زبان دارند کمک کنیم. او توضیح می‌دهد که وظایف پیش‌بینی زبان درنهایت شبیه مغز به‌نظر می‌رسند. ما در مقاله حدس می‌زنیم که شاید آنچه جامعه پردازش زبان طبیعی انجام می‌دهد چیزی شبیه تکامل جامعه باشد. اگر یک معماری AI را انتخاب کنید و به‌خوبی کار کند، سپس بخش‌هایی از آن‌را که کار می‌کنند، «جهش» می‌دهید، آن‌را با معماری‌های دیگری که به‌خوبی کار می‌کنند ترکیب می‌کنید و معماری‌های جدید می‌سازید. این معماری هر‌دو مدل مغز و هوش مصنوعی‌ست که مارتین احساس می‌کند بینش بالقوه نهایی این مطالعه باشد، اگرچه این مدلی‌ست که آثار آن هنوز در‌حال‌مشاهده است؛ درحالی‌که شبکه‌های عصبی را می‌توان بر روی داده‌ها آموزش داد تا عملکرد بهتر یا مشابه‌تری با مغز داشته باشند، به‌نظر می‌رسد ساختار زیربنایی آن‌ها اهمیت زیادی دارد. مارتین توضیح می‌دهد؛ گویا این ساختارهای ذاتی در مدل‌ها چیزهای زیادی به شما می‌دهد. اگر به این مدل‌ها نگاه کنید، هنوز چیزی حدود 50‌درصد از آموزش آن‌ها بر روی داده‌ها را به‌دست می‌آورید اما فکر می‌کنم هیچ‌کدام از ما انتظار نداشتیم که این ساختار شما را در فضای بازنمایی مناسب قرار دهد. آینده تحقیقات هوش مصنوعی شریمپ و همکارانش بر گسترش یک پلتفرم اطلاعاتی متمرکز شده‌اند که مقادیر زیادی از این‌نوع داده‌ها و مدل‌های زبان را جمع‌آوری می‌کند و آن‌ها را برای جامعه علمی در سطح وسیع برای کمک به تسریع پیشرفت بیشتر دردسترس قرار می‌دهد. درحالی‌که هیچ هدف نهایی واحدی برای این‌نوع تحقیق وجود ندارد، مارتین تشخیص می‌دهد که ایجاد درک جامع‌تری از شناخت و درعین‌حال استفاده از این درک برای ایجاد برنامه‌های کاربردی عملی که قادر به کمک به افراد هستند، دو روی یک سکه هستند. او می‌گوید؛ این چیزها ازنظر علمی مفید هستند؛ زیرا آن‌ها بخشی از یک فرضیه علمی یکپارچه از همه چیزهایی هستند که ما درباره یک فضای مغزی خاص می‌دانیم. من درحال‌حاضر روی تحریک مدل‌سازی کار می‌کنم. در حالت ایدئال، سوژه‌ای را روی صندلی داشته باشیم که به صفحه‌ای خاکستری نگاه می‌کند، سپس از مدل می‌پرسیم؛ اگر بخواهم باور کند سگی را بر صفحه خاکستری می‌بیند، چه نوع واکنشی خواهد داد و درخواست کنیم که این واکنش را توضیح دهد. سپس مغز را طبق آن تحریک می‌کنیم و آن‌ها یک سگ را می‌بینند. من فکر می‌کنم این یک جهت خوب برای بینایی است. چیزی شبیه به این‌را می‌توان با زبان انجام داد. همچنین این محقق درباره چگونگی کمک‌کردن به کسانی‌که مشکل زبان دارند گفت؛ فکر می‌کنم یک جهت وجود دارد من محتاطانه امیدوار هستم. چنین تحقیقات و پروژه‌هایی بی‌شک الهام‌بخش مکالمات جدید درزمینه‌های یادگیری ماشینی، علوم اعصاب و شناخت خواهند بود. همچنین بر یکی از بحث‌های شدیدتر در جامعه علمی تأثیر می‌گذارد؛ بحثی که می‌پرسد آیا مغز اصلاً مدل خوبی برای یادگیری ماشینی‌ست یا خیر و آیا این‌موضوع حتی اهمیت دارد یا خیر؟

ارسال دیدگاه شما

بالای صفحه