Нейрокибернетика
Источник: журнал «Наука и жизнь», №5, 1960 г. Авторы: С. Н. Брайнес, профессор, А. В. Напалков, к.б.н., В. Б. Свечинский, инженер.
ИЗУЧЕНИЕ СЛОЖНОСТИ
Наука в наши дни идёт в широкое наступление на целом ряде фронтов. Она проникает в тайны микромира, вскрывая строение атома, и штурмует космос.
Существует и ещё одна область, где намечаются не менее значительные перспективы. Это направление можно условно назвать изучением сложности. Многие явления живой природы и, в частности, многие физиологические процессы не поняты и не изучены до настоящего времени не потому, что их нельзя увидеть под микроскопом или они слишком удалены от поверхности Земли, а потому, что они слишком сложны.
Проблемы сложности, или, иначе говоря, изучения сложных физиологических систем, представляют собой одну из очень важных задач. Такими сложными системами являются, например, комплекс ферментативных процессов, лежащих в основе пищеварения, регуляция уровня кровяного давления, фотосинтез растений и т. д. Среди подобных систем особое место занимает головной мозг человека, состоящий из многих миллиардов особым образом связанных и взаимодействующих друг с другом нервных клеток.
Исследователи обычно пользуются экспериментальными методами расчленения системы на отдельные составные компоненты, например, изучают отдельные химические реакции, протекающие при переваривании пищи, химические превращения, происходящие при сокращении мышц, и пр. Но полученные результаты, сами по себе очень ценные, не могут, как правило, привести к пониманию функционирования всей системы в целом. Ведь принципы работы сложной системы нельзя просто свести к сумме закономерностей, выявленных при исследовании отдельных частей этой системы. Точно так же нельзя понять, например, на основании изучения отдельных радиодеталей (радиоламп и др.), каким образом передаёт изображение телевизор. В сложных системах проявляются качественно новые явления, которые невозможно объяснить, исходя только из простых элементов.
УЧЕНИЕ ПАВЛОВА И КИБЕРНЕТИКА
Проблема изучения сложных систем уже давно привлекала к себе внимание физиологов. Этому посвящены и основные труды И. П. Павлова. Великий учёный разработал ряд методов, позволяющих наблюдать живой организм как нечто целостное, изучать те тончайшие процессы управления и регуляции, которые осуществляются нервной системой. Исследование с этих позиций головного мозга, знаменитая теория рефлекторной деятельности произвели в своё время переворот в науке. На основании проведённых экспериментов И. П. Павлов считал, что в процессе работы головного мозга в коре больших полушарий создаётся сложнейшая мозаика из возбуждённых и заторможенных элементов.
Учение И. П. Павлова о высшей нервной деятельности с успехом продолжает развиваться как в Советском Союзе, так и за рубежом. Новые перспективы открылись здесь в последнее время неожиданно для многих физиологов в результате развития такой науки, как кибернетика.
Кибернетика имеет дело с изучением систем двух основных категорий: радиоэлектронных, созданных человеком (кибернетические машины), и существующих в природе, возникших в процессе эволюционного развития органического мира (живые организмы).
Здесь можно выявить некоторый определённый общий круг закономерностей и явлений, связанных с процессами переработки информации и управления. Общность является результатом функционирования сложных систем, состоящих из большого числа особым образом связанных друг с другом и взаимовлияющих элементов.
Наличие этих общих закономерностей, конечно, не означает, что можно поставить знак равенства между головным мозгом и машиной. Подход к их изучению должен быть различным в силу их природы. При изучении кибернетических машин человек имеет дело с творениями собственных рук. Он может разделять их на составляющие узлы, исследовать работу отдельных элементов.
С живыми организмами это не так просто, а часто и вообще невозможно. Вместе с тем в природе мы находим такие сложные системы, принципы и механизмы, которые до сих пор ещё не могут быть воспроизведены в машинах. Изучение их, особенно головного мозга, представляет большой интерес для кибернетики.
Здесь возникает интересная взаимосвязь. С одной стороны, при исследовании головного мозга могут быть выявлены важные теоретические закономерности работы сложной системы управления, которые могут иметь большое значение для развития теоретической кибернетики. С другой – достижения кибернетики могут быть использованы для понимания физиологических процессов, лежащих в основе работы головного мозга, для разработки ряда актуальных проблем физиологии.
Таким образом, определяется специфический круг вопросов, связанных с изучением головного мозга. Как по характеру проблем, так и по специфике применяемых методов он в значительной степени отличается и от технической кибернетики и от проводившихся до сих пор физиологических исследований. Рождается новая отрасль науки – нейрокибернетика.
ТЕОРИЯ НЕРВНОЙ СЕТИ
Развитие кибернетики позволило приступить к созданию общих теорий функционирования сложных систем, осуществляющих процесс управления и переработки информации. Мы остановимся на одной из них, так называемой теории нервной сети.
Суть её сводится к следующему. Как известно, головной мозг состоит из множества нервных клеток – нейронов, – которые определённым образом соединены между собой. Здесь осуществляются сложные процессы переработки информации, получаемой из внешнего мира. Задача заключается в том, чтобы узнать, какова структура этих сетей и каким образом взаимодействуют нейроны. Чтобы преодолеть трудности, связанные с попыткой изучения всей совокупности связей нервных клеток, используется метод абстрактного научного анализа.
Абстрагирование от множества свойств, присущих конкретному, для выявления некоторых закономерностей является общепризнанным научным методом. От конкретного к абстрактному и вновь от абстрактного к конкретному – так учит марксистско-ленинская теория познания.
Для изучения управления и переработки информации возможно временно абстрагироваться от химических процессов, лежащих в основе функционирования нейрона, и сосредоточиться лишь на его логических функциях. На этой основе было создано несколько абстрактных моделей нейронов. Одна из них – формальный нейрон – была сделана в 1943 году американскими учёными Мак-Каллохом и Питтсом. Это – упрощённое математическое описание подлинного нейрона. Формальный нейрон, так же как и подлинный, может иметь два состояния: возбуждённое и невозбуждённое. Различным образом соединяясь между собой, нейроны дают отличающиеся одна от другой нервные сети. К ним оказалось возможным применить методы математической логики и таким образом изучать проявляющиеся там явления и закономерности.
Абстрактный метод исследования чрезвычайно важен, но нужно подчеркнуть, что он не является исчерпывающим.
Изолированный путь математической логики не может привести к вскрытию физиологических механизмов работы головного мозга, так же, например, как изучение законов оптики само по себе ещё не означало понимания физиологических механизмов деятельности органа зрения.
Именно таким недостатком страдает теория нервной сети. Она не учитывает данные, накопленные физиологией. Построенная в отрыве от учения И. П. Павлова о высшей нервной деятельности, она не даёт должного представления о существующих в мозгу нервных сетях, обеспечивающих столь сложное поведение животных.
Интересно, что ещё в 1902 году И. П. Павлов в своей знаменитой речи «Естествознание и мозг» говорил: «...вся жизнь от простейших до сложнейших организмов, включая, конечно, и человека, есть длинный ряд всё усложняющихся до высочайшей степени уравновешиваний внешней среды. Придёт время – пусть отдалённое, – когда математический анализ, опираясь на естественнонаучный, охватит величественными формулами уравнений все эти уравновешивания, включая в них, наконец, и самого себя».
Нам кажется, что только такая программа, то есть комплексное использование экспериментального и абстрактного методов,– верный путь к успеху.
ОТ ЖИВОТНОГО – К МАШИНЕ
Сейчас уже стало почти привычным, что машина может управлять станком, делать переводы с одного языка на другой, быстро производить сложнейшие вычисления. Но для этого в машину нужно вложить программу действия, зашифровав её особым образом, так, чтобы она была «понятна» для автомата. А чтобы заготовить такую программу, нередко тратится масса времени и сил. Учёных уже перестают удовлетворять подобные машины; они ищут пути их совершенствования, думают об электронном «помощнике», обладающем способностью реагировать на изменение внешних условий, учитывать их, «разумно» взаимодействовать с внешней средой. То есть речь идёт о самоорганизующейся системе, способной самостоятельно составлять программу своей работы. Машина такого рода должна обладать способностью отбирать только надёжную, достоверную и только нужную информацию. Ведь если будут запоминаться все данные, поступающие из внешней среды, то эффективно работать она не сможет, её «память» окажется заполненной ненужными сведениями.
Кроме того, такая кибернетическая система должна иметь определённую цель своей деятельности, что и является критерием при отборе полезной информации.
Наиболее совершенная самоорганизующаяся система – головной мозг. Но как идёт в нем переработка внешней информации? Как происходит отбор нужных фактов? Чтобы выявить эти важнейшие принципы, мы пошли путём физиологических экспериментов, основываясь, с одной стороны, на учении И. П. Павлова, с другой – на достижениях кибернетики.
Для того, чтобы решить какую-либо задачу, необходимо руководствоваться целой системой правил – алгоритмом. Прежде всего мы исследовали алгоритмы, при помощи которых головной мозг животного ищет наивыгоднейшую – оптимальную – программу поведения при взаимодействии с внешней средой. Для этого в ходе опыта создавались условия, в которых подопытные собаки могли получать пищу, только исполнив несколько неизвестных им ранее последовательных действий: например, животное получит пищу в том случае, если при свете белой лампочки нажмёт педаль; услышав звонок, прыгнет на тумбу. Собака через некоторое время вырабатывала необходимую программу действий.
Какие же «приёмы» использует собака для «составления» программы работы мозга?
Сначала подопытное животное начинает производить случайные действия, запоминая при этом те изменения в окружающей обстановке, которые приводят к положительному результату. Не сразу оно приходит к окончательному выбору: белая лампочка – звонок – педаль – прыжок на тумбу – пища. В этом сходство работы живого мозга с кибернетическим устройством. Но собака не запоминает всю поступившую в мозг информацию и все свои действия при решении задачи получения пищи. Она запоминает только ту информацию и те движения, которые необходимы в данном случае. Остальные, не приведшие к результату, она отбрасывает, забывает.
Таковы отличия головного мозга от кибернетической машины, хранящей и необходимую и ненужную информацию.
Однако самоорганизующаяся система должна не только предусмотреть правила порядка действий при работе, а и возможность быстрейшего отыскания сведений. Это один из самых трудных вопросов. Ведь к сведениям, поступающим непосредственно при действии машины, прибавляются и те, что уже были накоплены при предыдущей работе. Накапливается много сведений, которые ныне действующие машины должны, как правило, просматривать полностью. Специальное устройство сравнивает хранящуюся информацию с той, которую надо отыскать.
Головной мозг быстро выдаёт необходимые сведения, без просмотра всех хранящихся в нем данных.
Как же «отыскиваются» сведения в головном мозгу? Ведь пока учёные не могут вести непосредственное наблюдение за его процессами! Для получения ответа на этот вопрос были проделаны следующие опыты. После выработки программы действий для получения пищи у собаки вызывали жажду. Чтобы напиться, она должна была «работать по другой программе». При формировании у животного нового поведения в цепь различных сигналов, связанных с получением воды, оказались включёнными и сигналы, при помощи которых оно получало пищу. Значит, сведения, хранящиеся в памяти, стали использоваться для построения новой программы действия.
Оказалось, что в головном мозгу тоже происходит сверка данных памяти с теми, которые поступают из внешней среды. Улавливается совпадение сигналов в мозгу и внешней среде при помощи особых нервных элементов.
На этом заканчивался первый этап работы.
Вторым являлся анализ выявленных закономерностей с точки зрения теории нервной сети. Мы ставили перед собой задачу – разработать модель нервной сети такой структуры, которая могла бы обеспечить воспроизведение наблюдавшихся в опытах явлений.
Завершающий шаг – создание радиоэлектронной машины, реализующей те принципы, которые были выявлены на животных.
«ОБУЧАЮЩИЙСЯ» АВТОМАТ
И вот «обучающийся» автомат существует. Уже не в чертежах, проектах и планах, а реально.
Он был создан физиологами, работающими в Академии медицинских наук СССР, и инженерами Московского энергетического института.
Что представляет собой машина? Ничем не примечательный с виду аппарат, величиной с обычный книжный шкаф. (Это очень скромные размеры, если вспомнить, что кибернетическая машина, производящая, например, вычисления и переводы, одна занимает несколько больших комнат.) Роль «входов» – источников информации – играют четыре кнопки, на которые нажимает человек, представляющий в данном случае внешнюю среду. Кнопка нажата – возникает возбуждение, передающееся в электронный «мозг». Ответом на возбуждение служит «действие», проявляющееся в виде зажигания одной из трёх лампочек, находящихся на пульте управления. Кроме того, имеется особая кнопка – «поощрение». Нажатие её вводит в автомат информацию о том, ведёт ли совершенное действие к нужному результату. Когда аппарат подключён к какому-нибудь реальному производственному процессу, к входам подводятся провода, несущие информацию об изменении температуры, давления и т. п., а к выходам – исполнительные устройства, регулирующие эти различные параметры управляемого объекта.
Каким образом автомат моделирует, воспроизводит выработку цепи условных рефлексов? Предположим, мы хотим, чтобы автомат выполнил следующие действия: в ответ на нажатие второй кнопки зажёг третью лампочку, затем при нажатии четвертой кнопки зажёг первую лампочку и т. д. Только после этого он достигнет цели (в нашем опыте цель – нажатие кнопки «поощрение»).
Всё это напоминает постановку эксперимента на животных. Нажатие, скажем, второй кнопки аналогично включению звонка, четвертой – зажиганию лампочки, а ответное включение автоматом третьей и первой лампочек соответствует действиям собаки (нажатие лапой на педаль, прыжок на тумбу и т. д.).
Вначале автомат не обучен: он зажигает лампочки, то ость совершает «действия», случайно, не отвечает правильно на нажатие кнопок. При этом если одно из «действий» совпадает во времени с нажатием какой-либо кнопки и совпадение сопровождается «поощрением», то это «запоминается» автоматом. При повторении такой ситуации несколько раз автомат «обучается» и теперь при нажатии определённой кнопки всегда отвечает зажиганием заданной лампочки.
Для того, чтобы машина «запомнила» именно всю цепь в её последовательности, в неё было введено специальное устройство, позволяющее различать, какая из связей образовалась раньше. Таким образом, если вначале автомат нуждается в подкреплении действием извне (в нашем случае – человеком), то затем он научается сам оценивать полезность той или иной информации. Новые «условные рефлексы» вырабатываются на основе подкрепления одним условным раздражителем ранее уже выработанных рефлексов.
В основу принципа работы автомата положена гипотеза о структуре нервной сети, обеспечивающей условно-рефлекторную деятельность. Вот схема этой сети. Все рецепторные (воспринимающие) «нейроны», видимо, могут соединяться со всеми эффекторными (командными), – каждый с каждым. Между ними находится группа переключательных нейронов. Когда автомат «не обучен», переключательные «нейроны» не пропускают возбуждения от рецепторных нейронов к эффекторным. После некоторых совпадений, о которых говорилось выше, определённая группа переключательных нейронов начинает пропускать возбуждение от данного рецептора к данному эффектору. Такая сеть позволяет в процессе обучения автомата связать любой раздражитель, воспринимаемый этой сетью, с любым действием, которое она может вызвать.
Эксперименты, проведённые с автоматом, показали, что в известных условиях, которые определены его конструкцией, он может «исследовать» внешнюю среду и на этой основе самостоятельно вырабатывать новые программы своей работы. Он производит отбор, запоминает только полезную и достоверную информацию и решает поставленную перед ним задачу.
Запоминаются только те сигналы, которые несколько раз совпадают с получением подкрепления. Такое многократное совпадение является показателем того, что во внешней среде имеются определённые закономерности, а не случайное совпадение двух сигналов. Очень важно, что в процессе работы автомата появляются новые «ориентиры», которые затем служат для оценки полезности и отбора вновь поступающей информации.
О БУДУЩЕМ
Представьте себе далёкую таёжную больницу. Действие происходит через несколько лет. В палате – только что доставленный тяжелобольной. Молодому врачу, склонившемуся над его постелью, никогда не приходилось встречаться с таким случаем. Симптомы противоречивы и никак не укладываются в рамки диагнозов, приходящих на память. А ведь от того, насколько быстро и правильно будет определено заболевание, как скоро начнут лечение, зависит жизнь человека! Как же поступит врач? Будет срочно добиваться квалифицированной, опытной помощи? Конечно, да. Но консультацию он получит не у седовласого профессора, специально вызванного ради этого за многие тысячи километров. (Ведь профессор может и не успеть вовремя!) Безотказный помощник врача, услугами которого можно воспользоваться в любую минуту, находится здесь же, в больнице. Это самопрограммирующийся автомат, хранящий в своей «памяти» огромный запас «опыта», различных признаков болезней. В машину заложены данные: температура, частота пульса и ряд других симптомов. Механические «нейроны» пришли в движение, сравнивая, сопоставляя, отбрасывая ненужное. Через минуту диагноз поставлен: это – очень редкое, почти забытое заболевание. Тут же автомат перечисляет возможные приёмы лечения. Картина ясна, человек спасён!
– Фантазия! – скажете вы. Да, сегодня это кажется фантастичным, но через несколько лет, мы думаем, такими аппаратами будут снабжены все больницы, все поликлиники. Они могут быть даже более совершенными, чем тот, о котором только что шла речь; могут сами измерять температуру тела, «выслушивать» биение сердца и т. п. Такие самонастраивающиеся системы могут «пройти курс обучения» у выдающихся клиницистов и сохранить, отложив в своей «памяти», их колоссальный практический опыт.
Знаменитый французский клиницист Труссо писал, что большинство диагностических ошибок происходит не от незнания врачей, а оттого, что некоторые не могут в нужный момент вспомнить ряд существенных симптомов, вовремя мобилизовать все знания. Диагностические машины во многом уменьшат возможность таких ошибок, так как их механическая «память» не забывает ничего.
Не менее перспективно применение самонастраивающихся систем и в технике. Такая машина может быть использована для управления малоизученными технологическими процессами. Она сможет, выявляя закономерности в действиях оператора, со временем заменить его. А это означает не только новый шаг в автоматизации производства, облегчение труда человека, но и избавление от вредных воздействий, например, в химической промышленности. Работа над таким «автоматическим диспетчером» активно ведётся в Московском энергетическом институте.
НА СТЫКЕ НАУК
Дальнейший прогресс кибернетики зависит теперь не только от математиков и инженеров, но и от физиологов. Эта мысль проникла уже в умы исследователей. И если раньше многие зарубежные учёные не признавали идей И. П. Павлова, то теперь, как это ни парадоксально, через кибернетику они приходят к ним. В Массачусетском институте технологии (США) созданы биологические лаборатории для изучения нервной системы. Закономерности, найденные при исследовании биологических явлений (в частности процессов нервной регуляции), используются при создании новых физических аппаратов и в технологии автоматики.
Издающийся в Федеративной Республике Германии журнал «Электронные вычислительные машины» напечатал статью профессора К. Штейнбуха, где прямо указывается на необходимость развития павловского учения для решения проблем «обучающихся автоматов».
На организованной ЮНЕСКО летом прошлого года Международной конференции по переработке информации был заслушан доклад советских учёных по нейрокибернетике, основанный на принципах И. П. Павлова. Все это свидетельствует о большом интересе и важности, которые приобретают павловские идеи, исследование условнорефлекторной деятельности животных и человека для создания «думающих» машин.