Команда итальянских психологов разработала искусственный интеллект на базе нейронных сетей, который учится распознавать информацию так же, как и реальный человек. Изучая программу, ученые смогли узнать весьма интересные факты о принципах работы человеческого мозга.

Изучение человеческого разума невероятно интересно с точки зрения науки, но также сопряжено с рядом опасностей и весьма спорных вопросов этического и физиологического характера. Способов много, но все они, как правило, имеют «темную» сторону. Можно проводить опросы о самочувствии участников эксперимента — но они часто сами не знают, что ответить, и путаются в показаниях. Можно сканировать мозговое вещество, но современные инструменты для этого часто или недостаточно точны, или обходятся очень дорого. Можно провести хирургическую операцию на мозге, но малейшая ошибка будет стоить пациенту рассудка. Таким образом, современной науке приходится изобретать многочисленные уловки и строить догадки относительно разума человека, и в этом она похожа на ребенка, который только учится складывать из отдельных букв слова и предложения.

Психологи нашли элегантное решение проблемы и предложили использовать для изучения интеллекта человеческого интеллект искусственный. Марко Зорзи (Marco Zorzi), психолог из Университета Падуи в Италии, использовал искусственные нейронные сети, чтобы продемонстрировать, как мозг может «захватывать» уже существующие связи в зрительной коре, чтобы распознавать буквы алфавита, о чем он и его коллеги сообщили в прошлом месяце на страницах журнала Nature Human Behaviour. В то же самое время он дал журналу весьма интересное интервью, из которого портал Science выделил самое интересное.

Что вы узнали во время исследования восприятия мозгом алфавита?

Для начала мы натренировали ИИ на анализ изображения дикой природы, в частности деревьев и горных пейзажей, что в дальнейшем помогло программе использовать знания о базовых визуальных паттернах как инструмент для анализа формы той или иной буквы. Это воплощение концепции «нейронной рециркуляции»: она существует в научной среде уже некоторое время, но, как мне известно, наша команда стала первой, кто смог продемонстрировать в этой области какие-либо конкретные наработки. Мы стали свидетелями того, что модель ИИ, которая обучалась на фотографиях природы, справлялась с анализом букв куда лучше, чем та, которая эту процедуру не прошла. Рециркуляция в данном случае значительно ускоряет обучение, что уже делает подобную программу весьма перспективной.

Как работает системное обучение?

Программа использует алгоритм «бесконтрольного» обучения. После предварительного обучения на естественных фотографиях, мы, как уже было сказано, загрузили в базу данных изображения букв без каких-либо отметок. Цель этой работы заключалась в том, чтобы создать внутреннюю модель анализа данных, найти ее скрытую структуру. Она называется «генеративной», поскольку генерирует шаблоны и на их основании учится интерпретировать новую сенсорную информацию по принципу «сверху вниз».

Позже более простой алгоритм учился размещать определенные буквенные надписи на том или ином изображении. В этом случае мы контролировали его, указывая программе, правильно ли она поступает, но большая часть работы все-таки была проделана без контроля с нашей стороны.

Почему вы уделили такое внимание бесконтрольному обучению ИИ, которое используется намного реже контролируемого?

Когда мы говорим о контролируемом обучении, то подразумеваем, что у вас есть ментор, наставник со стороны. В реальном мире люди обычно лишены этого и учатся на собственных пробах и ошибках. К тому же, в мозге много связей, информация по которым передается в обе стороны. Более того, там даже существует особая форма внутренней активности, обнаружение которой является одним из самых значительных достижений за последние 20 лет опытов в области нейровизуализации. Она вызвана не сенсорными стимулами и работает по совершенно иному принципу: сначала сигнал активирует нейроны в верхних слоях мозгового вещества, а потом активность распространяется по соседним клеткам подобно паутине. Можно охарактеризовать проявление этой активности как некую «мечту» или «образ». В сочетании с сенсорной деятельностью обратная связь «сверху вниз» приводит к интерпретации ввода. Простой пример: даже если написанное слово частично закрыто, читатель все равно может достроить его структуру, основываясь не только на визуальном сигнале, но и на своих собственных знаниях.

Другим преимуществом неконтролируемого обучения является то, что в отсутствие конкретных задач знания не привязаны к конкретному приложению программы, так что она легко освоит любую новую задачу. Опять же, пример: сначала вы учите, что такое «число», а после применяете это понятие для того, чтобы научиться арифметике в целом.

Как сказано в вашей работе, часть нейросети, которая проходила обучение на образах дикой природы, все еще лучше распознает письма, написанные от руки, нежели составленные из печатного текста. Означает ли это, что написанное от руки чем-то похоже на природу?

Да, это одна из гипотез. Существует мнение, что форма того или иного буквенного символа была выбрана таким образом, чтобы лучше соответствовать привычной нам визуальной среде. Можете думать об этом как о нашей программе: сначала мозг «учится», запоминая внешний вид окружающей природы, а потом придумывает буквы на основе ранее усвоенной информации.

Что еще вы узнали о механизмах познания человеческого мозга?

Нам известно, что маленькие дети и животные могут сравнивать различное число объектов даже без знаний о том, что такое цифры. Мы обнаружили, что глубокое неконтролируемое обучение с использованием изображений, содержащих различное количество объектов, создает в нейронной сети похожее «визуальное число». Это первый раз, когда с помощью глубокого обучения программа научилась когнитивному моделированию.

В случае с нейронными сетями у вас всегда есть алгоритм обучения. Можно сравнить это с этапами человеческого развития. К примеру, возьмите обучение чтению: если у вас есть компьютерная модель, которая учится читать, можно попытаться также понять принципы и атипичного обучения, как в случае дислексии.

Вам удалось узнать что-нибудь о дислексии?

Сейчас ведутся жаркие споры. В чем корень всех бед? Ученые рассматривают дислексию с точки зрения фонологических, визуальных отклонений, а также синдрома дефицита внимания. В исследовании, которое мы пока не публиковали, нам удалось обнаружить, что если не предположить, что дислексия вызвана дефицитом более чем в одной области, то и нет никакого способа объяснить разнообразие реального проявления этого отклонения у детей. Но если мы используем этот подход, то нужно попытаться создавать не безликие, а персонализированные программные модели конкретных людей и, используя все то же моделирования, прогнозировать на их основе результаты того или иного воздействия на пациента.

Можно ли с помощью моделирования улучшить мозг так же, как ИИ?

Я думаю — да. Чем шире наши познания о том, как именно мозг учится анализировать информацию и какие процессы протекают в нем, тем более успешные способы по обучению человека мы сможем создать.