
Современные системы искусственного интеллекта способны писать эссе высокого уровня и помогать врачам диагностировать заболевания с высокой точностью. Однако, когда дело доходит до настоящей ментальной гибкости, живой мозг по-прежнему имеет явное преимущество. Люди могут приспосабливаться к новым ситуациям и информации с удивительной легкостью. Освоение незнакомого программного обеспечения, проба нового кулинарного рецепта или изучение правил новой игры у человека часто происходит быстро, тогда как системы ИИ обычно испытывают трудности с адаптацией в реальном времени и эффективным обучением «на лету».
В новом исследовании нейробиологи из Принстонского университета определили одну из ключевых причин этого различия. Человеческий мозг многократно использует одни и те же когнитивные «блоки» в самых разных ситуациях, комбинируя и перестраивая их для формирования новых моделей поведения. Результаты научной работы были опубликованы 26 ноября в журнале Nature.
Старший автор исследования и заместитель директора Института нейронаук Принстона Тим Бушман отметил, что современные передовые модели ИИ могут достигать человеческой или даже сверхчеловеческой производительности в отдельных задачах, но им трудно учиться и выполнять множество разных действий. Ученые обнаружили, что гибкость мозга обеспечивается его способностью повторно использовать компоненты познания. Соединяя эти своеобразные «когнитивные кубики», мозг способен выстраивать выполнение новых задач.
Этот процесс называется композиционностью. Если человек уже умеет настраивать велосипед, обучение ремонту мотоцикла может показаться ему более простым. Ведущий автор исследования Сина Тафазоли пояснил, что способность создавать новый навык из более простых и знакомых, взятых из смежного опыта, похожа на кулинарию. Если вы умеете печь хлеб, вам не нужно учиться печь торт с нуля: вы перепрофилируете существующие навыки – использование духовки, измерение ингредиентов, замешивание теста – и объединяете их с новыми, такими как взбивание крема, чтобы создать нечто совершенно иное.
До сих пор доказательства того, как именно мозг поддерживает такой тип гибкого мышления, были ограничены. Чтобы получить более ясную картину, Тафазоли обучил двух самцов макак-резусов выполнять три взаимосвязанные задачи, одновременно регистрируя активность их мозга. Вместо реальных действий, таких как выпечка или ремонт, животным предлагалось выполнять визуальную категоризацию. На экране они видели серию разноцветных расплывчатых пятен. Их задача состояла в том, чтобы решить, на что больше похоже пятно – на кролика или на букву T (категоризация формы), или же определить, выглядит ли оно более красным или более зеленым (категоризация цвета).
Сложность эксперимента заключалась в том, что пятна различались по четкости. Некоторые изображения явно напоминали кролика или были ярко-красными, в то время как другие оставались двусмысленными и требовали тщательной оценки. Чтобы сообщить о своем решении, обезьяна указывала ответ, глядя в одном из четырех направлений на экране. Важной частью эксперимента было то, что каждая задача имела свои правила, но разделяла ключевые компоненты с другими. Это позволило исследователям увидеть, использует ли мозг одни и те же нейронные паттерны всякий раз, когда задачи имеют общие черты.
Изучив паттерны мозговой активности, ученые обнаружили, что префронтальная кора – область в передней части мозга, отвечающая за мышление высокого уровня и принятие решений, – содержала несколько повторяющихся схем активности. Эти паттерны появлялись всякий раз, когда группы нейронов работали вместе для достижения общей цели, например, различения цветов. Бушман сравнил эти паттерны с функциями в компьютерной программе: один набор нейронов может различать цвет, а его выходные данные могут быть наложены на другую функцию, управляющую действием. Такая организация позволяет мозгу выполнять задачу, последовательно реализуя каждый её компонент.
В ходе эксперимента выяснилось, что при выполнении одной из цветовых задач мозг собирал блок, определяющий цвет изображения, вместе с другим блоком, направляющим движения глаз. Когда животное переключалось на другую задачу, например, оценку формы при сохранении схожих движений глаз, мозг просто активировал блок обработки формы вместе с блоком для тех же движений глаз. Это совместное использование компонентов наблюдалось в основном в префронтальной коре, что говорит об уникальности данной области мозга для процесса композиционности.
Кроме того, исследователи заметили, что префронтальная кора, по-видимому, подавляет определенные когнитивные блоки, когда они не нужны. Это, вероятно, помогает мозгу сосредоточиться на наиболее актуальной задаче в данный момент. Тафазоли отметил, что мозг имеет ограниченную способность к когнитивному контролю, поэтому необходимо временно «сжимать» некоторые способности, чтобы сфокусироваться на важных. Например, концентрация на форме на мгновение снижает способность кодировать цвет.
Открытие «когнитивных кубиков» может объяснить, почему люди часто способны так быстро осваивать новые задачи. Мозгу не всегда нужно начинать с чистого листа; вместо этого он может опираться на существующие ментальные компоненты, перекомбинировать их и избегать дублирования работы. Эту стратегию современные системы ИИ, как правило, не используют.
Тафазоли подчеркнул, что серьезной проблемой машинного обучения является «катастрофическая интерференция». Когда нейронная сеть учится чему-то новому, она часто забывает и перезаписывает предыдущие данные. Если искусственная сеть знает, как печь торт, но затем учится печь печенье, она может забыть первый навык. Внедрение принципов композиционности в ИИ могло бы в конечном итоге сделать процесс обучения машин более похожим на человеческий, позволяя им приобретать новые навыки, не стирая старые.
Те же принципы могут повлиять и на медицину. Многие неврологические и психиатрические состояния, включая шизофрению, обсессивно-компульсивное расстройство и некоторые формы повреждения головного мозга, затрудняют применение существующих навыков в новых ситуациях. Эти проблемы могут возникать, когда мозг больше не может плавно перекомбинировать свои когнитивные строительные блоки. Понимание того, как мозг повторно использует знания, в долгосрочной перспективе может помочь в разработке методов терапии для восстановления этих процессов.