Эта работа содержит в себе описания некоторых исследований, проведенных на хомяках с целью изучения поведенческих феноменов. Опыты были воспроизведены на основе работ американских психологов Эдварда Л. Торндайка (1874–1949) и Эдварда Ч. Толмана (1886–1959). Я исследовал процесс, в котором хомяки «научались» выбегать из лабиринта, и влиявшие на это условия. Толман, проводя подобные опыты с крысами, писал, что у крыс и у людей образуются когнитивные карты в нервных системах. Я же напротив, применяя научный метод, хочу показать, что этот процесс можно объяснить по-другому. Я, как сторонник научного подхода, опираюсь на скиннеровский анализ поведения и на философию бихевиоризма. В статье я показываю, что столь сложное поведение как «выход из лабиринта» можно разбить на составляющие, и объяснить с помощью факторов подкрепления, не прибегая к ненаучным объяснениям.
Ключевые слова: бихевиоризм, экспериментальный анализ поведения, когнитивная психология, животные, эксперименты.
This work includes a description of several studies that were conducted on hamsters for the understanding of behavioral phenomenon. Based on these studies, an experiment was made with the purpose of understanding the processes and factors that took part in the hamsters learning ability to exit a «maze». The experiments were reconstructed after Edward L. Thorndike's (1874–1949) and Edward C. Tolman's (1886–1959) works. In contrast to Tolman's experiments that resulted with the conclusion that cognitive maps exist within animals and human's nervous system, this study — that conducted with the influence of Skinner's Behavior Analysis and Behaviorism philosophy — shows how a complex behavior, such as exiting a maze, can be dismantled into several components and explained by contingencies of reinforcement, without the need for nonscientific explanations.
Keywords: Behaviorism, experimental analysis of behavior, cognitive psychology, animals, experiments.
Современный анализ поведения настолько отличается от первых экспериментов по исследованию поведения животных, что любой человек, который слегка углубится в эту область, сразу убедится в том, что речь идет о самой настоящей естественной науке. Он поймет суть анализа поведения, смысл его технического языка, и вскоре, возможно, даже примет те философские основы, на которые эта наука опирается, а именно — что поведение, в большей части, формируется и управляется воздействиями окружающей среды в течение всей жизни человека. К сожалению, по неизвестным причинам, сегодня значительно пренебрегают бихевиоризмом. Принципы поведения ошибочно трактуют, искажают (даже на факультетах психологии, социологии и иных гумманитарных наук), а о прикладном анализе поведения (ABA — Applied Behavior Analysis) вообще мало кому известно.
Я воспроизвел несколько опытов, очень похожих на те, что проводили в свое время Эдвард Ли Торндайк, Эдвард Чейз Толман и его коллеги. Я построил на относительно большой платформе лабиринт из книг, помещал туда хомяков, и наблюдал за тем, как они тренируются (более техничное слово — обусловливаются) выходить из него. Я измерял время, требующееся хомякам для выхода из лабиринта, наблюдал за происходящими событиями, и замечал много тонкостей, которых, наверное, упустили из виду Толман и другие ученые. Об этих «тонкостях» пойдет речь в третьей главе о Содержании опытов. Должен отметить, что, скорее всего, из-за того, что Толман упустил эти, весьма важные, характеристики, это послужило причиной тому, что он стал выдумывать некие «когнитивные карты» для объяснения ислледуемого поведения. К сожалению, этой идеей (о когнитивных картах, о которых дальше пойдет речь), и иными похожими теориями засорена большая часть современной психологии. Эти «тонкости», которые я заметил позволяют объяснить сложное «навигационное» поведение грызунов с помощью терминов, которые связаны с наблюдаемыми физическими процессами. Еще одна из причин, по которой, как мне кажется, Толман был занят выдумками, кроется в том, что у него, насколько мне известно, не вышло наткнуться на книгу Б. Ф. Скиннера «Поведения организмов», опубликованную в 1938-ом году (11 лет до опубликования статьи Толмана, о которой в дальнейшем также пойдет речь). В книге Беррес Скиннер подробно описал принципы сложных видов поведения (оперантов).
Опыты Эдварда Торндайка были намного проще, но он также использовал неверные термины для описания процессов, за которыми наблюдал. Что-ж в те дни только зарождался тот подход, который в будущем приведет к созданию новой науки.
В следующем разделе я напишу обстоятельный обзор о работе каждого из этих ученых. Особенно подробно опишу работу Эдварда Толмана.
Можно сказать, что данная статья есть одновременно: 1. так сказать, ответ Толману и современным когнитивным психологам, и 2. описание полученных данных из воспроизведенных мною опытов.
После следующей главы следует глава о методологии, а затем, глава, в которой содержится описание поставленных мною опытов. Если читателю неинтересна теоретическая предыстория и положение разных ученых, касательно данного предмета, он смело может пропустить следующую главу, и перейти к главе о методологии, а затем наслаждаться точными данными и описанием опытов.
Обзор литературы
Наука, это прежде всего объективный способ познавать действительность. Но что означает слово «объективный»? Поскольку даже многие ученые в современном мире, точно не понимают, что означает «объективность», то перед тем, как начать описывать ранние труды психологов по данному предмету, я бы хотел прояснить то значение слова «объективность», которое придаю ему я. В дальнейшем читателю станет яснее, что я имею ввиду, когда я буду пользоваться этим словом.
В словаре русского языка Ожегова С. И. слово «объективный» имеет следующие два значения: 1. Существующий вне нас как объект. 2. Непредвзятый, беспристрастный. В википедии пишется: «Объективность — принадлежность объекту, независимость от субъекта; характеристика факторов или процессов, которые не зависят от воли или желания человека (человечества)». Отсюда можно предположить, что это слово означает, что мы, пользуясь научным методом, якобы, описываем то, что есть на самом деле, без «предвзятого отношения». Однако это не так. Невозможно узнать, как что-то есть на самом деле, ведь когда ученый ставит опыт, он узнает или открывает лишь то, что ему удалось заметить [Коржибски А., 1933]. А то, что он смог или может заметить, зависит от строения его собственной нервной системы, деятельности органов чувств и жизненного опыта. Становится очевидно, что ученый, как и любой другой человек, может что-то упустить. Он напишет о том, о чем узнал, а затем другой ученый, который прочитает его работу может воспроизвести опыт и заметить что-нибудь другое, новое. Именно так в жизни и происходит, и именно таким образом «течет» научный, познавательный процесс. Такой подход мы называем объективным, и к нему придерживаемся. Однако как уже было сказано, наука не дает нам понять, как что-то есть на самом деле. Приведу пример — если обычный человек и лесовод окажутся рядом в лесу, лесовод сможет «увидеть» намного больше, чем обычный человек. Почему? Благодаря опыту. Оба находятся в одном и том же месте, оба могут не придерживаться никаких религиозных, философских или психологических идеологий (если затронуть, так называемые, субъективные подходы для познания мира), но взор лесовода будут «тянуть» к себе, так сказать, больше деталей в его поле зрения. Не существует полностью «объективного» подхода. Субъективность есть и в объективном, и в субъективном подходах. (Для наглядности, к субъективным подходам можно причислить религию, философию, рационализм и т. д.). Однако существует значимое отличие. В объективном (эмпирическо-научном) подходе предвзятость находятся на уровне восприятия органами чувств. То есть, ученые эмпирики просто «созерцают», они наблюдают, и лишь затем пытаются словесно описать увиденное и экспериментировать с переменными. Но как уже отмечалось выше, они могут «созерцать» лишь то, что позволяет им жизненный опыт и деятельность нервной системы. Предвзятость субъективных и рациональных подходов находится на «мыслительном» уровне. То есть, субъективность зависит уже от религиозных, культурных или философских ценностей, установок и так далее. На мой взгляд, научный, объективный, эмпирический подход поныне самый плодовитый и благоприятный способ для познания природы. Ведь, очевидно, что, когда человек рождается в этот мир, первая его связь с действительностью происходит через органы чувств, а не через «разум» или через «слова». Теперь, когда читателю стало яснее, что означает научный подход и слово объективность как я их вижу (хотя я считаю, что и большинство ученых и, возможно, обычных людей с этим согласятся) я приступаю к обзору трудов и работ ранних психологов когнитивистов и бихевиористов.
Об Эдварде Ли Торндайке, и о Берресе Ф. Скиннере
Торндайк открыл Закон Эффекта или Воздействия[1] и первым стал говорить об отборе последствиями в контексте эволюции [Catania A. C., 1998]. В своем труде Animal Intelligence. An Experimental Study of the Associative Processes in Animals, 1898-го года Торндайк описывает разные опыты и исследования, которые он проводил на животных для изучения того, что он называл «ассоциативными процессами».
В статье Торндайка 1898-го года для журнала Science, он пишет о новом предмете изучения (ассоциативные процессы). Он утверждает, что в жизни индивида данный вид деятельности более значим, чем «чувственные способности» (sense-powers) или инстинкты [стр. 812]. Отсюда становится ясно, что Торндайк был одним из первых, кто увидел отличия рефлекторного (респондентного) поведения от оперантного, поскольку те виды поведение, которые он исследовал (ассоциативные процессы, умственная деятельность и т. д.), сегодня мы называем оперантным поведением (термины трактуются в главе о методологии). В жизни человека сложное поведение более значимо, чем простые рефлексы или врожденные инстинкты.
В своих опытах Торндайк помещал голодных животных (кошек, собак и цыплят) в различные ящики, которые сам изготавливал, и проверял количество времени, требовавшееся животным для того, чтобы выбраться наружу. Он проверял сколько попыток нужно животным для того, чтобы «научиться» выбираться из ящика, и описывал то, что видел с помощью таких терминов как «ассоциативные процессы». Когда животные выбирались, они получали пищу. Торндайк строил разные ящики, каждый из них имел определенный механизм: где-то нужно было потянуть петлю, где-то нажать на рычаг и так далее. Но общая суть была такова. Животное помещалось в ящик и, лишь совершая определенный вид поведения, оно могло выбраться. Таким образом, можно сказать, что каждый ящик «вынуждал» животных вести себя по-разному. Торндайк отмечал, что, когда кошки помещались в ящик, им было неприятно, они грызли и царапали стенки.
Изучая это явление, Торндайк заметил, что с каждым повторением, животные выходили быстрее и совершали меньше лишних движений, что не приводили к «успеху» (царапание стен, хаотичное движение в ящике и так далее). Это дало Торндайку обнаружить то, что он назвал Законом Эффекта, и начертить известные кривые научения. (Похожие графики с кривыми научения я также начертил, и они будут представлены в главе о Содержании опытов).
Такое явление — «научение» животных нажимать на рычаги и решать задачу, Торндайк назвал ассоциативными процессами. У животных возникают инстинктивные реакции, но лишь некоторые могут привести к «успеху»[2].
Закон Эффекта Торндайка есть хорошее описание данного явления. Это, наверно, одно из самых важных открытий в науке. Но, к сожалению, такое описание не очень подходит научному методу. Еще во времена работы выдающегося Ивана Петровича Павлова, в лабораториях он старался избегать слов, отсылающих к «внутренним агентам» и стремился использовать лишь те термины, которые обозначали наблюдаемое поведение [Академик Павлов: Избранные сочинения, 2015, стр. 181]. Однако, Павлов изучал более простые формы поведения, чем те, что исследовал Торндайк. Термины, которыми пользовался Торндайк, были заимствованы из обиходной речи, и были далеки от науки. Он писал, что кошка может «осознать» то, что «смысл» поворота определенной кнопки — «значит» открыть выход. Но можем ли мы увидеть, как кошка «осознает»? Или же мы видим определенное поведение в определенных условиях? Видеть «ассоциативные процессы» напрямую, возможно, могут только современные неврологи и нейро-биологи. Такие «процессы» действительно существуют, но они не являются предметом изучения науки о поведении. Их невозможно увидеть невооружённым глазом. А то, что мы наблюдаем глазами есть поведение. Даже мысль воспринимается как слабый вид поведения [Skinner, 1974]. Однако, как показывает современный анализ поведения, необязательно исследовать неврологические процессы для того, чтобы понять причины поведения и управлять им [Schlinger H. D., 2014, в интервью для Prosocial Progress Foundation]. Причины находятся во внешней среде и их можно наблюдать и отмечать. В данном случае (опыты Торндайка), причины поведения — это ящики, которые являются независимыми переменными, а функция ящиков — это поведение (зависимая переменная).
В начале 30-х годов молодой американский психолог по имени Беррес Фредерик Скиннер взялся за изучение поведения крыс, что привело его к изучению сложных видов поведения, слегка похожих на те, что изучал Торндайк[3]. После долгих лет экспериментов над крысами в точных лабораторных условиях, придавая большое значение каждой детали, Скиннер разработал объективную, техничную систему для исследования сложных видов поведения и опубликовал свою первую книгу Поведение организмов [1938].
В поведенческих процессах существует множество явлений, которых не объяснить обиходными или когнитивными терминами. Например, нам известно из опытов Скиннера, что кривая угасания[4] после длительного режима периодического подкрепления[5], гораздо больше и длительнее, чем кривая угасания после подкрепления каждой реакции по отдельности в течение короткого времени. Почему это так? Как можно объяснить это явление с помощью обиходных слов? Ведь если голодная крыса нажимает на рычаг, и каждый раз получает пищу, то мы говорим, что она «поняла» суть рычага. Но ведь, если голодная крыса будет нажимать на рычаг 15 раз и лишь каждое пятое повторение получать подкрепление, мы тоже можем сказать, что крыса «поняла» суть рычага. Используется только одно слово, но ведь процессов происходит несколько, и они разные. Также крысу можно тренировать в течение трех дней, каждый день по часу, либо ее можно тренировать лишь десять минут. В обоих случаях крыса «поймет» суть рычага, но дальнейшие кривые угасания будут отличаться. И как это объяснить обычными словами? Крыса после десяти минут «поняла», что рычаг уже не работает, а другая крыса «привыкла» к рычагу за время тренировок, и из-за этого «поняла позже», что он не работает? Нет, так не пойдет. Чтобы понять изучаемое явление, и в дальнейшем получать практическую пользу необходимо измерять точное количество реакций и точно отмечать все независимые переменные. Представьте, дорогой читатель, что произошло, если бы в электронике использовали обиходную речь? Вместо точных данных и чертежей говорили бы: «У этого резистора очень высокое сопротивление, а у того оно умереннее. Через этот транзистор может течь большое количество тока, а через тот поменьше» и так далее. Мы бы до сих пор жили без света и без тех благ, что дает нам электричество. А в случае с психологией и с человеческим поведением — мы все еще не понимаем поведение и поэтому страдаем.
Об Эдварде Ч. Толмане и о его статье
Эдвард Толман опубликовал статью под названием «Когнитивные карты у крыс и людей» в 1948 году. В ней он описывает ряд опытов, которые проводились в лаборатории Беркели университета Калифорнии и в других лабораториях. Опыты, описанные Толманом были таковы — голодные крысы помещались в разные лабиринты, или приборы, в которых, в определенных местах находился ящик с едой. В одном из опытов, он проводил с определенной крысой одну попытку каждые 24 часа, и отмечал, что с каждым разом крысе требовалось меньше времени, чтобы добыть пищу. Затем проводились опыты иного рода, которые далее будут подробно описаны.
Толман писал: «Все студенты были согласны с фактами. Они не принимали теорию и объяснение» [стр. 189]. Далее Толман описывает подход психологической школы «стимула-реакции», и их объяснение данного феномена. Он пишет, что они ссылаются на то, что стимулы окружающей среды (зрительные, слуховые, осязательные и т. д.) воздействуют на организм, и он отвечает реакцией. По мнению Толмана они превращали организм в «телефонный аппарат». Он явно не был согласен с этой точкой зрения. Затем он пишет про иной подход — вторую школу, к которой причислял самого себя. Он назвал эту школу «теоретиками поля» (field theorists). Они верили, что в процессе научения в мозгу крыс образуется что-то вроде карты некоего поля.
На мой взгляд, физиологическое объяснение, на которое опирались психологи школы «стимула-реакции», действительно не удовлетворяло. Можно сказать, что психологи данной школы описывали очевидные вещи, ведь очень легко установить, что на организм воздействуют стимулы и он отвечает реакцией. Но это не объясняет то, почему организм чаще или реже совершает то или иное сложное поведение в различных условиях. Однако Толман, пытаясь выдвинуть новое объяснение, перешел к иным очевидностям, которые находятся внутри нервной системы. Разумеется, что внутри организма всегда происходят всякие процессы. Но эти процессы нам мало что говорят о понимании причин поведения, и их использование в качестве объяснения ошибочно и тормозит развитие науки.
Толман описывает некий процесс образования карт и пишет, что у этих карт есть разные характеристики, которые он хочет исследовать. Он пишет, что карты могут быть относительно узкими и полосатыми, либо относительно широкими и всеобъемлющими. Также они могут быть правильными или ложными, и т. д. [стр. 193]. При этом он обращает внимание на связь между непосредственным опытом крыс и возникновением карт. То есть, если крыса была во многих случаях и обстановках и имела богатый опыт, то соответственно, ее «карта» или «карты» будут более обширными и более плодовитыми для решения задач. Точно также как человек с большим жизненным опытом будет знать, как правильно поступить в той или иной ситуации. Почему бы тогда нам не изучать непосредственно все характеристики события, и воздействия окружающей среды, с которыми сталкиваются крысы, и отмечать изменения в поведении? Ведь, когда Толман говорит о характеристиках карт, на самом деле он грубо описывает выводы на основе прямого наблюдения за поведением крыс в разных условиях. Зачем выдумывать метафоры и исследовать их, когда можно исследовать то, что видно напрямую? Зачем блуждать в потемках, пытаясь понять поведение, и делать двойную работу?
Далее в своей статье Толман описывает пять групп опытов, на основе которых он считает, что его теория верна: 1. Латентное научение, 2. Замещающие пробы и ошибки, 3. Поиск стимула, 4. Опыты «гипотезы», и 5. Пространственная ориентация.
- Латентное научение
Толман описывает ряд опытов, которых вводит в категорию под названием «Латентное (скрытое) научение». Он описывает опыты, проведенные в лаборатории Беркели, университета Калифорнии, в 20-е годы, 20-го века ученым, по имени H. C. Blodgett. Блоджет вводил три группы крыс поочередно в лабиринт. Первую группу (контрольную) он запускал в лабиринт раз в день и в конце повторения они находили пищу (в лабиринт крысы помещались по отдельности). С каждым разом отрезок времени, требующийся для нахождения пищи, укорачивался, рисовалась кривая научения. Две другие группы — II и III были экспериментальными. Крысы второй группы помещались в лабиринт, в котором не было корма в течение шести дней (каждый день проводилось одно повторение). То есть грызуны просто помещались в лабиринт и бегали там. Крысы третьей группы также помещались в лабиринт без пищи, но только в течение первых трех дней. Затем экспериментаторы добавляли пищу в лабиринт для обоих групп. Для второй группы ящик с пищей поставили в конце лабиринта впервые лишь на седьмой день, а для третьей группы его добавили на четвертый день. Затем, те крысы, которые уже несколько дней бродили по лабиринту без пищи, находили ее намного быстрее, чем те крысы, которые впервые поместились в лабиринт, в котором изначально была пища (первая группа). Суть заключается в том, что даже без еды крысы «запоминали» лабиринт. По мнению Толмана, это являлось доказательством образования, так называемых, когнитивных карт.
В главе о Содержании опытов, я опишу воспроизведение подобного опыта, и объясню это явление иначе (через описание факторов подкрепления). Дело в том, что в данном случае пища не является единственным подкреплением. Существуют иные значимые стимулы, о которых я напишу позже.
Толман описывает метафорическим образом некоторые процессы, которые, возможно, происходят в нервной системе. Я не против метафор при условии, что мы знаем, что это лишь метафоры, и что у нас пока нет объективного объяснения. Но затем Толман пишет, что крысы могут «изъять» из карты то, что им надо в любое время и воспользоваться этим. Я, как и остальные бихевиористы и поведенческие аналитики, считаю это неверным.
Далее Толман пишет о похожих опытах, поставленных K W. Spence и R. Lippitt в 40-х годах, которые на его взгляд, лучше демонстрируют это явление и подкрепляют его теорию. Они построили закрытую площадку в форме английской буквы «Y». Если представить, что мы наблюдаем на эту площадку сверху, то нижняя часть буквы «Y», это точка старта, куда помещали животных. А в верхних частях буквы, в каждой стороне было по одному ящику «вознаграждения». В одной стороне был ящик с водой, а в другой — ящик с кормом. Вначале опытов в площадку помещали сытых и не жаждущих крыс. Крысы бегали по обоим проходам и их оттуда забирали и помещали в другие клетки с другими крысами. Затем животных разделили на две группы — одну составляли голодные крысы, а другую жаждущие попить. Их поочередно помещали в ту же площадку. Толман пишет, что голодные крысы, шли чаще в сторону, где находилась еда, а жаждущие крысы чаще устремлялись к воде. Как писалось выше, Толман считает, что эти опыты лучше показывают, как у грызунов образуются когнитивные карты окружающей местности.
Что ж, я попытаюсь объяснить иначе — Крысы видели много раз воду в определенном месте, а еду в другом. Образовалось респондетное (Павловское) обусловливание. К примеру, всем нам знаком случаи, в котором мы кладем куда-то какую-то вещь и уходим. А когда в будущем она нам понадобится, мы идем искать её в том же месте, где оставили. Также может произойти так, что если тотчас, когда мы кладем вещь, наше внимание чем-нибудь отвлекается. Мы уходим после этого, оставив ту вещь, и в дальнейшем можем забыть, где мы её оставили. Здесь мы имеем дело с респондентным обусловливанием. Когда мы имеем дело с рефлексами, у нас открывается возможность иметь количественные характеристики поведения. Силу рефлекса (если речь идет о респондентном обусловливании) можно измерять количеством произошедших повторений, интенсивностью стимула по отношению к реакции и так далее. А силу оперантов можно измерять количеством времени, требуемого крысам добежать до корма или до воды, прогнозировать количество реакций, которые будут появляться в период угасания (если мы уберем корм и воду с тех мест) и так далее. Количественность и точность позволяют нам создать науку, и избежать лишние когнитивные метафоры.
- Замещающие пробы и ошибки
Перед описанием хода опытов, Толман сначала описывает строение аппарата в опытах K. S Lashley из конца 20-х годов. Крысу ставили на невысокую стойку, из которой можно было прыгать. Напротив стоял большой аппарат, на стенке которого были два отверстия с дверцами на уровне высоты стойки, на которой находилась крыса. Дверцы были закрыты (но одну из них можно было открыть, если её толкнуть). Дверцы отличались некоторыми свойствами, обе были полосатыми, но на одной из них линий были горизонтальными, а на другой вертикальными. Если крыса прыгала в одно отверстие, то дверь открывалась, и крыса попадала внутрь, и там был корм. Если крыса прыгала в другое отверстие, она ударялась и падала вниз.
Потом Толман описывает опыты, которые сам воспроизвел, и о которых опубликовал статью в 1939. Его аппарат был иным. Перед дверцами (в которые крыса должна была прыгнуть) была поверхность, и на ней была стенка между дверьми, разделявшая эту площадь. В таком случае, если крыса прыгала в сторону неправильной двери, она приземлялась на поверхность и, соответственно, могла развернуться и прыгнуть обратно на стойку.
Толман пишет, что когда выбор был более легким для различения (одна дверь была белой, а другая черной), то «животное не только научалось быстрее, но и повторяло больше попыток» [стр. 197], что звучит весьма противоречиво. Этот, описываемый им процесс «проб и ошибок» и есть процесс, так называемого, научения! Трудно понять, что Толман имел ввиду. Я считаю, что это описание не достаточное. В конце абзаца Толман пишет, что этот опыт подкрепляет его теорию, поскольку крысы не реагируют пассивно на стимулы, но активно различают их. Этому феномену Скиннер посвятил целую главу в книге Поведение организмов [1938], где детально и технично описал суть этого явления. Это называется поведение под контролем дискриминативного или различительного стимула. Об этом феномене также писал Павлов, только он наблюдал его в респондентном поведении, а не в оперантном, как Толман и Скиннер. Эту группу опытов, также можно объяснить через факторы подкрепления.
- Поиск стимула
Толман описывает опыты Брадфорда Хадсона (Bradford Hudson. Ph.D.), в которых тот создает у крысы достаточно сильный условный рефлекс лишь от одного обусловливания (речь идет о респондентном обусловливании). Крыса находится в специальной клетке и касается металлической кормушки, чтобы получить пищу. В это мгновение она получает сильный электрический удар. На стене, из которой выпирает кормушка, начерчен полосатый узор и после удара крыса начинает его избегать. Хадсон заметил, что после электрического удара крыса начинала смотреть вокруг и «искать» от чего произошол этот удар током. После этого, у него возникла интересная мысль. Что будет если во время удара скрыть узор? «Крысы могут не установить ассоциацию» [стр. 201]. После этого Толман пишет, что Хадсон устроил обстановку так, что когда крысу ударяло током во время касания кормушки, свет на секунду отключался. На сутки позже крысу помещали в клетку. Она не избегала узора на стене. После описания данного опыта Толман вновь утверждает, что и это подкрепляет его теорию. Но ведь обусловливание может сформироваться и под влиянием других нейтральных стимулов, которые присутствуют вместе с подкрепляющим стимулом. Например, через сто таких повторений крыса, наверное, начнёт бояться находиться в этой клетке.
В отличие от опытов второй группу, где изучалось оперантное поведение под контролем различительного стимула, в этих опытах мы имеем дело с респондентным поведением. Это явление очень тщательно исследовал Павлов и детально его описывал.
- Опыты «гипотезы»
Этот вид опытов, на мой взгляд, ничем не отличается от опытов второй группы, поэтому описывать его не буду. В нем также подкрепляются «выборы» крыс, правильные проходы в лабиринте. Если читателю интересно узнать об этой группе опытов, он может прочесть статью Толмана, которая указывается в конце данной работы в списке литературы.
- Пространственное ориентирование
Данную группу опытов я опишу более подробно, чем остальные, поскольку один из таких опытов я воспроизвел. Данные о нем и о ходе опыта я опишу в главе о Содержании опытов.
Толман описывает необычный случай, произошедший во время опытов Lashley, проведенных в 1929 году. Крыс, ранее обученных находит пищу в лабиринте, поместили в очередной раз в лабиринт, и они отодвинули крышку над местом старта, залезли наверх, пробежали в прямом направлении в ту сторону, где находился ящик с пищей, и кое как добрались до него. О похожих случаях также сообщали иные исследователи. Толман считает, что у грызунов сформировалась более обширная «карта». Однако, читая его статью, я заметил, что он ни слова не писал о прошлом его крыс. Нигде не пишется об их жизненном опыте, следовательно, нам ничего неизвестно об их истории подкрепления. Вероятно, Толман и иные исследователи, о которых он пишет в своей статье даже не знают о значимости таких данных. Вольфганг Келер (1887–1967), немецкий психолог исследователь, из-за подобной ошибки выдумал некий «инсайт»[6] (или «озарение»). Он наблюдал за тем, как человекообразные обезьяны решали задачи, при этом не зная ничего об их прошлом. В 1982 году вышел короткий документальный фильм Берреса Фредрика Скиннера и Роберта Эпштейна, где они показывают, как голубей можно натренировать решать сложные задачи. Они объясняют этот процесс факторами подкрепления, и затрагивают тему «инсайта» Келера. Я не утверждаю, что такого явления в «психике» не существует. Каждый из нас, находясь в обстановке, где нужно решить какую-то задачу, внезапно может ощутить некое озарение и понять, что делать. Однако это озарение не есть причина поведения, а лишь малое звено очень длиной цепи истории обусловливания. Озарение лишь маленькая часть этого события.
Возвращаясь к опытам Толмана, можно предположить, что те крысы так делали, поскольку раньше они, возможно, много лазили на различные поверхности. А в лабиринте, после того, как они «выучили его», то, так сказать, включилось поведение «залезть наверх».
Дальше Толман описывает опыт, который провел с двумя учеными (этот опыт описывать не буду), и еще один похожий опыт, но более простой, проведенный одним исследователем, которого звали B. F. Ritchie (также в лаборатории университета Калифорнии Берекли). Именно этот опыт я и воспроизвел, и об этом напишу в дальнейшем.
В опыте крысы пробегали на столе в форме буквы «Т» (см. рис. 1) в одну из сторон. 25 крыс были обучены в течение недели (20 повторении в итоге) находит корм в одной стороне, а другие 25 крыс в другой. На восьмой день стол повернули на 180 градусов, закрыли центральный проход, который вел к распутью, но добавили новые пути, исходящие из круглой площади. Крысы помещались на стартовое место, и добегали до прохода, где было закрыто. Заметив это, крысы возвращались в центральную площадь, некоторое время там блуждали и недоумевали, а затем выбирали один проход и выбегали через него. Толман отмечает, что на этот раз большинство крыс выбегало не в ту сторону, где должна была находиться пища (то есть, в отношении самого лабиринта), а в сторону, которая была перпендикулярна соответствующим сторонам комнаты, в которой этот лабиринт находился. Это явление дало Толману полагать, что у крыс формировались «карты» комнаты, а не площадки, в которой они бегали. Но ведь это явление тоже можно объяснить факторами подкрепления. В данном случае присутствовал различительный стимул (стены), под контролем которого находилось поведение. Почему именно стены контролировали поведением крыс в той обстановке? Скорее всего ответ находится в их прошлом, и в особенностях физиологии и морфологии организма.
В заключение своей статьи Толман пишет, что, возможно, и у людей создаются различные когнитивные карты. Он приводит разные примеры общественных проблем и неврозов.
Статья Вейсберга и Ньюкомби «Когнитивные карты: некоторые люди создают их, другие страдают»
Авторы этой рукописи пишут, что данная точка зрения (когнитивные, навигационные карты) поддерживается многими нейропсихологами, которые непосредственно наблюдали работу нейронов и визуальную картину мозга. Я сомневаюсь, что эти нейропсихологи могли наблюдать напрямую сами «карты». Что это вообще такое? Что означает термин «когнитивные карты»? Их можно как-то увидеть? Они видели нейрофизиологические процессы, но не «карты». Очевидно, что разные процессы существуют в нервной системе. Было бы абсурдно их отрицать. Но эти процессы (к примеру, те, что происходят в нервной системе крысы, когда та обусловливается), не являются «картами». Обусловливание не может происходить без прямого взаимодействия и адаптации с внешней средой. Эти процессы и есть поведение только на более меньшем масштабе, и на них также воздействуют стимулы из внешней среды. Факторы подкрепления влияют на нервную систему и изменяют её деятельность [Schlinger H. D., 2014, в интервью для Prosocial Progress Foundation].
Далее авторы описывают иное воззрение. Они пишут, что грызуны и люди полагаются, так сказать, на некие отпечатки в воспоминании мест и на маршруты в навигации [Shettleworth, 2010, Warren, Kothman, Schnapp, Ericson, 2017], а затем авторы утверждают, что эти два вида объяснения (которые почти одинаковы, на мой взгляд), «конфликтуют» между собой. Затем авторы утверждают, что этому спору есть простое решение: люди значительно отличаются в своей способности изучать большие среды и перемещаться в них [Hegarty &Waller, 2005; Wolbers & Hegarty, 2010]. У людей в самом деле более развита нервная система, но указание на такой очевидный факт не решает задачу, а лишь вводит в более глубокое заблуждение. Авторы описывают ряд экспериментов с людьми. Я не буду о них писать, поскольку не считаю их описание значимым для данной статьи. Лишь коротко выскажусь и отмечу, что в опытах проверяли способности разных людей из различных групп запоминать определенные маршруты. Тут проблема даже не в том, что авторы не пишут об истории подкрепления этих людей, а в том, что нервная система взрослого человека настолько развитая структура, что может контролироваться огромным числом стимулов внешней среды, в отличие, например, от животного. Даже ребенок может иметь очень масштабный репертуар поведения (например, большой словарный запас, различные навыки и так далее), и таким образом становится просто бессмысленно проводить на людях опыты подобного рода. В конце статьи авторы также пытаются объяснить эти формы поведения людей (запоминание маршрутов) ассоциативными процессами в нервной системе.
Критика когнитивной психологии
Я читал о когнитивном подходе из разных источников, но в основном из тех, что связаны с психотерапией. Для того, чтобы понять общую суть этого подхода, я решил прочесть главу под названием «Когнитивная психология» из книги «История зарубежной психологии 30-е-60-е годы ХХ века», изданной Московским Университетом в 1986 году. На основе того, что я прочитал (и на основе того, что мне было известно до этого), я буду критиковать этот подход.
После второй мировой войны, возникла «новая» наука. Ее предметами изучения стали такие «психические процессы» как восприятие, память, внимание, решение задач, речь и так далее. Подход когнитивной психологии совмещал в себе некую смесь кибернетики и методологического бихевиоризма Уотсона: они уподобляли организм человека компьютеру: человек получал информацию, «перерабатывал» ее, «сохранял» в памяти, а затем извлекал в нужное время.
Если, например, коснуться темы восприятия и внимания, то откуда мы знаем, что человек «обращает внимание» или «воспринимает»? Очевидно, что через прямое наблюдение за его поведением. И если то, что мы видим есть поведение, значит мы можем это анализировать с точки зрения анализа поведения, выявить контролирующие стимулы из окружающей среды. Например, в борцовском зале тренер обучает ребят выполнять новую технику. Он находится по середине зала с одним из учеников и показывает, к примеру, как выполнять тот или иной бросок, или проход в ноги. Во время демонстрации он выполняет особое движение рукой, которое с первого взгляда весьма трудно разглядеть, но которое, предположим, является ключевым в данной технике. К примеру, какой-нибудь захват кисти. Тренер знает о том, что необходимо обратить внимание ребят на это движение, чтобы они научились хорошо выполнять технику, и говорит им: «Обратите внимание на мою руку, я хватаю его кисть», и ученики смотрят. Так какой же процесс тут произошел? Некие когнитивные процессы в сознании учеников? Или мы видим, как их поведение изменилось под воздействием стимулов из внешней окружающей среды? Да, процессы в нервной системе безусловно всегда происходят, но они не являются нашим предметом изучения. Также данные процессы не являются причинами поведения (они могут быть лишь причинами того, что организм вообще может себя как-то вести, или, причинами того, что он живёт, но эти очевидности не дают нам понимать, как управлять поведением и прогнозировать его). Тренер попросил учеников обратить внимание, это есть антедецент, или предшествующее событие, различительный стимул. Ученики смотрят на его руку (при условии, что они знают значение того языка, на котором тренер говорит т. е., существуют ли у них обусловленные рефлексы данных слов и т. д.), это есть поведение, или реакция на различительный стимул. Ученики видят, как работает техника, это постцедент, последующее подкрепляющее событие. Затем ученики пробуют выполнить технику, но это уже другая цепочка поведения. То, что мы наблюдаем есть взаимодействия организмов с окружающей средой — для тренера все ученики и неодушевленные предметы есть окружающая среда, его поведение также подкрепляется поведением учеников (если бы его никто не слушал, он бы скорее всего перестал быть тренером), а для каждого ученика также остальные ученики, тренер и неодушевленные предметы являются окружающей средой. Организм ведет себя именно так, как он ведет себя из-за прошлых событий. Процессы переработки в нервной системе существуют, но они предмет изучения неврологов, физиологов и так далее. Они ни в коем случае не являются предметом изучения когнитивных психологов. Им лишь кажется, что они их изучают. В 1974 году Беррес Скиннер опубликовал книгу «О бихевиоризме», в которой он детально и подробно объясняет различные сознательные, речевые и прочие процессы через факторы подкрепления. Общий вывод из этой книги, на мой взгляд, таков — когнитивные процессы есть поведение.
Хочу еще добавить, что еще задолго до возникновения «когнитивной науки», разными учеными предпринимались подобные, и, по-моему, более плодовитые инициативы познавать и изучать «когнитивные» явления. К сожалению, об этих ученых сегодня мало говорится.
В 1863 году великий исследователь, физиолог Иван Михайлович Сеченов (1829–1905) опубликовал свой главный труд «Рефлексы головного мозга». В нем он, на основе данных доступных физиологии в 1863 году, пытается разобрать и описать всю деятельность человека. Он делает это через призму самого простого рефлекса (стимул-S → реакция-R), и разделяет человеческое поведение на «вольные и произвольные движения». Чуть позже, в 1867 году, публикуется первый том книги «Человек как предмет воспитания» выдающегося педагога Константина Дмитриевича Ушинского (1824–1871). В этом труде он тоже затронул огромное количество тем, таких как строение нервной системы и деятельность сознания (насколько, конечно, позволяли его знания до 1867 года). Эти работы были началом изучения человеческой деятельности как научного предмета, а продолжением и развитием стал радикальный бихевиоризм и анализ поведения. Также, я хотел бы упомянуть еще одного почтенного ученого — Альфреда Коржибского (1879–1950). В 1921 году он издал первую книгу «Зрелость человечества», а в 1933 году, после долгих лет опытов и исследований он опубликовал свой основной труд «Наука и здравомыслие», где описывает разработанную им дисциплину под названием общая семантика[7]. В этой системе Коржибски пытается объяснить сложные формы человеческого поведения такие как «речь», процессы познания, а также добавляет новую точку зрения о философии науки и прочее. Он описывает некоторые формы поведения весьма метафорически, ненаучно, подобно когнитивным психологам, но то, как он это делает имеет намного большую ценность, ибо он считает значимым воздействия окружающей среды на поведение, и пишет о том, что организм вместе с окружающей средой являются одним целым. Коржибски описывает речь, а точнее язык, ни как форму поведения, а как самостоятельную, ограниченную систему знаков, которая может управлять поведением (в отличии от Скиннера, который делал упор на речи именно как на поведенческом процессе). Коржибски описывает новые техники для того, чтобы «лучше пользоваться» языком, и предлагает способы улучшения языка. В описаниях своих разработок он также ссылается на работы Ивана Павлова, Чарлза Дарвина, Жака Лёба и иных ученых.
Методология
Методология, на которую я опираюсь в своем исследовании, весьма проста — эмпирическое наблюдение за исследуемым явлением (поведением) и применение терминологии анализа поведения для объективного описания. Я опишу термины, которые буду использовать в данной работе, и с которыми читатель уже сталкивался в предыдущей главе:
Факторы подкрепления — «Это связь между действием, его последствиями и случайными условиями, в которых действие приводит к этим последствиям. Некоторые ученые делают акцент на одном из звеньев этой цепи и понимают контингенции (факторы) как условия, существующие в момент, когда за реакцией следует подкрепление». — Отрывок взят из предисловия переводчика для книги под названием «По ту сторону свободы и достоинства» Б. Ф. Скиннера, переведенной на русский язык. В самой книге переводчики настаивают на том, что не стоит переводить термин с английского (Contingencies of reinforcement), и пишут, что на русском языке лучше оставить термин как он есть: «Контингенции подкрепления». Они считают, что в русском языке нет подходящего слова, значение которого соответствует значению английскому слову. Слово Contingency подразумевает, что есть два события, которые связаны между собой, и то, что эта связь образовалась случайно. Такие слова как — фактор, условие, обстоятельство, случайность и т. д. не имеют такого значения, и соответственно, не подходят для перевода. Однако я все же решил использовать слово фактор (из словаря русского языка Ожегова С.И: Фактор — Момент, существенное обстоятельство в каком-нибудь процессе, явлении). Я выбрал это слово по двум причинам: 1) Я считаю, что нужно стараться соблюдать литературные нормы русского языка, и 2) значения слов не есть нечто устойчивое, непоколебимое, чего нельзя изменить. Когда слово фактор будет использоваться в словосочетании факторы подкрепления, оно будет иметь то же значение, что и английское слово Contingency.
Рефлекс — единица поведения. Представляет собой, в основном, респондентное, рефлекторное поведение (непосредственное влияние вызывающего стимула на организм, который вызывает ответную реакцию, например, вызывающий стимул, — свет — который приводит к реакции — сужению зрачка).
Оперант — некое безусловное, врожденное поведение, которое не имеет очевидного вызывающего стимула. Оно проявляется случайно в определенных условиях, и в определенной частоте. Оперант обычно может состоять из цепочки простых рефлексов. Опернатом мы называем такое поведение, которое определенным образом воздействует на окружающий мир и приводит к изменениям. Оно будет обозначаться так: s.R.
Оператное обусловливание — если за оперантом следует подкрепляющий стимул, вероятность того, что он возникнет в будущем в подобных условиях — возрастает.
Закон образования цепочек — реакция одного рефлекса может представлять собой или порождать вызывающий или различительный стимул другого рефлекса (Скиннер, 1938).
Отрицательное подкрепление — если организм находится в неприятных для него условиях, любое поведение, которое поможет ему избавиться от этого стимула (от неприятных условий), будет подкрепляться, и вновь проявляться в будущем в похожих условиях.
Аверсивный стимул — неприятный стимул, которого организм избегает.
Влечение (Drive) — гипотетическое «состояние» организма, находящегося под воздействием одного или нескольких стимулов, которые усиливают или изменяют силу некоторого поведения. (К примеру, причины состояния «голода» — это некоторый промежуток времени, в котором организм не ел, деятельность, которой организм занимался за этот период и т. д. В этом состоянии возрастает сила всех условных и безусловных рефлексов, связанных с добыванием и поглощением пищи).
Теперь я опишу животных, которых использовал в опытах, а затем исследуемое поведение.
Животные — я использовал лишь двух грызунов. Это два хомяка джунгарской породы — самец, который в этой работе будет называться хомяк 1, и самка — хомяк 2. Обоим отроду, примерно, год и три месяца. Я их получил, когда обоим был, приблизительно, год. Это значит, что у хомяков целая однолетняя история подкреплений, о которой мне ничего неизвестно. Поэтому, возможно, некоторые виды реакции, о которых я буду писать либо обусловлены, либо врожденны. Однако я больше склоняюсь к тому, что они врожденны. Опыты я начал проводить, когда хомякам был год и месяц. Хомяки здоровые, физически, и «психически». Они живут в хороших условиях с изобилием пищи, воды и т. д.
Возможно, читателю может показаться, что двух хомяков будет мало для таких опытов, но я считаю, что их вполне достаточно. Я не вижу смысла брать десятки хомяков и проверять их поведение в подобных обстоятельствах. Если все хомяки будут здоровыми то, скорее всего, на графиках будут видны лишь небольшие изменения, отражающие их индивидуальные генетические особенности (что нам в этой работе не особо интересно). Также цель этой работы воспроизвести уже поставленные опыты, а не исследовать процессы поведения ради новых научных открытий. Приведу еще один довод в свою пользу — цитату Скиннера: «Там, где возможно получить достаточную гладкость и воспроизводимость на нескольких или на одном-единственном случае, нет причин иметь дело с большими числами, кроме привычки и стремления к кажущейся убедительности». [2016, стр. 359 — переведенная на русский язык книга «Поведение организмов»].
Исследуемое поведение — я изучал, как хомяки выбегают из лабиринта. Лабиринты я буду описывать в следующей главе.
Содержание опытов
Еще перед началом проведения опытов, пытаясь научить хомяков выполнять какие-то трюки, я помещал их в закрытую площадку (обычно это был какой-то участок на полу, размером в квадратный метр, который был обставлен книгами) и пытался подкреплять всякие формы поведения кусочками яблока. Но любая попытка тренировать их была тщетной. Хоть и яблоко было сильным подкрепляющим стимулом (они его любили есть, даже когда были «сытыми» от обычного корма), частота реакций, которых я ожидал, возрастала, но лишь на очень короткое время (к примеру, я помещал в участок некий кубик или мячик и подкреплял хомяков, когда они его касались). Все, что хомяки пытались делать в этой площадке, было попыткой выбраться из нее. Они пытались вскарабкаться на книги, «рыть» пол и так далее. Так я понял, что одно из сильнейших влечений хомяков (в данных условиях), выражалось в оперантах побега из закрытого помещения. Если хомяка поместить в такое пространство, мы можем наблюдать, как он пытается вскарабкаться на стены и может делать это в течение двадцати минут, и даже дольше. Эти формы поведения можно описать как врожденные безусловные операнты (хотя, это не факт, ибо как уже упоминалось выше, мне неизвестна история подкреплений этих хомяков). Именно и на этих оперантах я буду изучать, как хомяки обусловливаются выбегать из лабиринта. Но перед тем, как описать лабиринт и ход исследования, я обозначу эти операнты более точными формулами:
s.R0 — основной оперант. Он выражается в «исследовательском» поведении. Хомяк просто перемещается, движется в пространстве, находится под контролем обонятельных, слуховых, зрительных, и, наверное, самых значимых — осязательных стимулов. В условиях лабиринта (где нет ни еды, ни воды, а пол плоский и проходы узкие), такое поведение подкрепляется, если хомяк проходит через проходы и «открывает» для себя новое, более просторное место. А также частота возникновения этого поведения в определенных условиях, быстро возвышается до наивысшей силы, что мы увидим по ходу описания опыта.
s.R:AB — возможно, тоже врожденный безусловный оперант. Он обозначает одновременно два топографически похожих видов поведения: А — хомяк пытается залезть, вскарабкаться на стены, и: В — хомяк пытается «рыть» пол. Поскольку операнты очень похожи (в них задействуют практически те же эффекторы, но в быстрых, фазных, противонаправленных движениях), они будут обозначены именно этим знаком. Эти два вида поведения можно описать Законом рефрактерного периода[8].
S1 — основным подкрепляющим стимулом в моих опытах будет появление «нового пространства для исследования». Можно сказать, что это является отрицательным подкреплением, поскольку хомяки стремятся выбежать из лабиринта.
Лабиринт— первый и основной лабиринт показан на рис. 2. В этом лабиринте в качестве стен стоят книги. Они поставлены на большой платформе, размеры которой 76 см в ширину, 122 см в длину и 15 см в высоту. Я помещал хомяков по очереди в место, где обозначен знак X и наблюдал за их поведением.
Обусловливание цепочки рефлексов
Влечения голода и жажды не контролировались (в своих опытах, Торндайк, Скиннер и Толман управляли этими переменными).
В моих опытах управлялись только влечение выбраться наружу, и два вида влечения, которых в этой работе я касаться не буду: влечение к яблоку, и влечение активности организма (которое сильно пересекается с влечением «выбраться наружу» из закрытого пространства). Когда хомяк находится в открытом пространстве, то «исследовательское» поведение умеренно — рефлексы, связанные с бегом, рытьем, вскарабкиванием и так далее относительно слабые. А когда хомяк оказывается в закрытом или узком пространстве, появляется состояние нехватки открытого пространства, и сила этих рефлексов существенно повышается. Первые попытки хомяков выхода из лабиринта я подкреплял яблоком (не зная о том, что это лишнее, потому что, как уже отмечалось выше, сам по себе выход из лабиринта оказался сильнейшим отрицательным подкреплением).
Итак, хомяки помещались по очереди. В первых попытках они исследовали местность, ходили по коридорам лабиринта (s.R0), и проявляли беспрестанно реакций рытья и вскарабкивания (s.R:AB). Хомяку 1 понадобилось 6 минут в первом повторении, чтобы выбраться из лабиринта. Хомяку 2–2:28 мин. (График и таблицу с точными данными см. на рис. 3). Первое повторение хомяка 2 оказалось весьма случайным, так как в трех последующих повторениях, как видно на графике и в таблице, промежуток времени был длиннее, чем в первом повторении. Хомяк 1 оказался более «сметливым», и во втором повторении он вышел из лабиринта за 1:47 мин. На пятом повторении у хомяка 1 сила операнта достигла почти наивысшей степени, а хомяку 2 нужно было семь повторений для похожего результата. С каждым повторением сила s.R:AB уменьшалась, пока не упала до нуля (хомяки больше не пытались рыть или карабкаться на стены). А сила s.R0 выросла до высшей степени. На последних повторениях, когда хомяки помещались в лабиринт, они мгновенно начинали бежать по пути к выходу (за исключением двух случаев, когда хомяк 1 в шестом повторении «завис», так сказать, в течение пятидесяти секунд, и просто неподвижно сидел, и изредка, «чистил», так сказать, самого себя. Тоже самое было с хомяком 2 в девятом повторении, я поместил его в стартовое место, и он сидел там неподвижно в течение пятидесяти пяти секунд.
Изменения в цепочке рефлексов
После того, как хомяки обусловились (Каждый совершил по десять повторений, т. е., произошло десять событий обусловливания) выходить из лабиринта, я слегка изменил его, чтобы проверить, как они поведут себя на этот раз (См. рис. 4). Я поместил на старт хомяка 2, но он сидел неподвижно в течение пяти минут. Мне показалось, что он сильно истощился, и я вернул его обратно в клетку. Я решил закончить с ним тренировки на этот день. (Скорее всего, ход опытов для хомяков был неприятным. Несмотря на то, что никакой боли им не причинялось, и они не были голодными, но частое помещение в лабиринт, скорее всего, напрягало и изматывало их).
Я поместил хомяка 1 в лабиринт. В первом повторении ему понадобилось всего лишь сорок секунд, чтобы выбраться. Второе повторение заняло 24 секунды. Данные результаты (одна неудавшаяся попытка хомяка 2, и два повторения хомяка 1) отображаются на графике на попытках 11 и 12.
Очевидно, что результаты данных двух повторений (0:40 и 0:24 сек.) значительно отличаются от данных двух первых повторений хомяка 1 в лабиринте 1 (6:00 и 1:47 сек.). Когнитивные психологи сказали бы, что у хомяка «образовалась» когнитивная карта лабиринта (данной платформы), и поэтому он «знал» как ориентироваться в данных условиях. Я, разумеется, не соглашаюсь с этим объяснением. Хомяк 1 находился в течение определенного количества времени в определенных условиях (лабиринт 1). В этих условиях, в репертуаре поведения хомяка наблюдались два операнта: s.R0 и s.R:AB. В течение десяти обусловливаний, в этом лабиринте, сила операнта s.R:AB снизилась до нуля, поскольку не приводила к подкреплению (в последних повторениях хомяк не пытался никуда залезть, и не пытался ничего порыть), а сила операнта s.R0 достигла наивысшего предела (в поздних повторениях хомяк 1 начал выбегать из лабиринта меньше чем за 18 секунд. Помимо основного подкрепляющего стимула, являющимся выходом из лабиринта, это поведение состоит из сложной цепочки оперантов (подробнее об этом я напишу на следующих страницах). То есть, подкреплялся не только основной путь, который приводил к выходу, но и повороты и проходы внутри самого лабиринта, которые являлись составляющими данного пути (доказательства этому приведутся дальше). Исходя из написанного выше, я объясню поведение хомяка в лабиринте 2. Когда хомяк 1 поместился в похожие условия (лабиринт 2), сначала в ход пошел тот оперант, который ранее усилился обусловливанием (s.R0). Хомяк будет исследовать местность, и если после каждого прохода или поворота будут открываться новые пространства, которые в итоге приведут к выходу из лабиринта, то оперант вновь получит свое подкрепление, что, собственно, и произошло.
На следующий день, я вновь помещал хомяков в лабиринт 1 (повторения отмечены на графике и в таблице на рис. 3). В первой попытке хомяк 1 выбежал за 31 секунду, а хомяк 2 за минуту. Затем, на втором повторений у обоих слегка подскочили результаты, а далее оперант вновь почти достиг своего порога.
Операнты возникают самопроизвольно, случайно, но отбираются окружающей средой. На вопросы почему вообще или почему изначально возникают те или иные виды поведения мы должны обратится к иному процессу отбора — естественному отбору. Однако этим занимаются другие науки (этология, эволюционная биология и так далее). Поведение есть функция окружающей среды. В данном опыте хомяк помещался в определенные условия, которые отличались от привычной обстановки в его обиходной жизни. Эти условия есть определенная окружающая среда, которая может порождать некоторые виды поведения (s.R0, s.R:AB и некоторые другие незначительные формы поведения). Но спустя некоторое время, после событий, в которых наблюдался процесс отбора, с данными условиями (которые кстати можно обозначить как различительный стимул лабиринт 1) связался оперант s.R0, который приводил к подкрепляющему стимулу S1 — выходу из лабиринта. Это событие можно обозначить короткой формулой:
Sd: помешение в лабиринт → s.R0: бег по особому пути → S1: выход из лабиринта
Где Sd есть предшествующее событие (помещение в лабиринт — различительный, умерено аверсивный стимул, который (ныне) приводит к операнту s.R0, поведению за которым следует последствие, отрицательное подкрепление S1. Важно помнить, что связь является условной.
Можно сказать, что поведение подобно реке. Текущую реку направляет русло, сила тяжести и прочие факторы. Реку, как и поведение, можно воспринимать как зависимую переменную, а факторы, влияющие на нее, как независимых переменных.
«Память»
Через месяц, я повторил тот же опыт. Я проверил как изменилась сила операнта, или, говоря обиходной речью: «запомнили ли хомяки как выходить из лабиринта»? За этот месяц бездействия, хомяки ни разу не видели лабиринты, жили спокойно в своих клетках. Полученные результаты можно увидеть на кривых и в таблице на рис. 5.
Результаты первых повторении меня удивили. Хомяк 1 пробежал лабиринт за 53 секунды, а у хомяка 2 это заняло минуту и 15 секунд. Обычный человек может сказать: «У хомяков хорошая 'память'», и начал бы описывать поведенческие процессы всякими словечками, которые отсылают к «сознанию», «памяти» и так далее. Но слово «память» имеет очень расплывчатый и неоднозначный смысл, который отсылает нас то в область нейрофизиологии, то в область метафизики, души и сознания. А то, что мы наблюдаем это операнты, которые управляются внешними, также наблюдаемыми, переменными и имеем количественные данные. Месяц назад, в этом лабиринте, хомяки прошли через 15 обусловливаний. Каждое такое событие имеет свой результат, свои точные характеристики. Пережив именно такие факторы подкрепления, хомяки, вновь попав в такую обстановку, показали именно такие, а не другие результаты. Что, если бы в первый день тренировок, каждый хомяк сделал бы только пять повторений? В таком случае нынешний график выглядел бы совершенно иначе. Несмотря на то, что хомяк прошел через пять обусловливаний, здесь также можно вставить слово «память», но это нам ни о чем не говорит. Мы имеем дело с процессом взаимосвязи организма с окружающей средой и с точными данными, которые помогают нам видеть, как изменения в условиях внешней среды в прошлом влияют на поведение. К тому же, точные количесвтенные данные и выявление различительных и подкрепляющих стимулов позволяют нам прогнозировать и управлять поведением. Управлять «памятью», «сознанием» или «душой», невозможно.
Вернемся к графику. Как мы видим дальше, на втором повторении хомяк 1 пробежал лабиринт за 11 секунд (высшая сила операнта), а хомяк 2 пробежал за десять секунд на четвертом повторении.
Угасание
Если за оперантом, который раньше усилился обусловливанием, больше не следует подкрепляющий стимул, то его сила начинает снижаться (Скиннер, 1938). После пяти повторений с хомяком 1 и восемью повторениями с хомяком 2, я решил проверить, что произойдет, если закрыть выход из лабиринта. Однако, когда я помещал хомяка 2 в лабиринт (эти повторения проводились только с хомяком 2) наблюдались разные реакций, в разные промежутки времени, и в разных местах лабиринта. Мне показалось весьма хлопотливым трудом записывать все, что я видел в таблице. Поэтому для данного опыта нет ни таблицы, ни графика. Я опишу лишь коротко общую суть того, что произошло. В первом повторении, хомяк 2 пробежал до выхода за 13 секунд. Там стояла книга и закрывала выход. Хомяк пытался найти этот выход, но не нашел. Через некоторое время он отправился обратно к исходной точке и остановился в определенном месте. Затем хомяк вновь проделал тот путь, по которому он был обусловлен выходить из лабиринта. В итоги я провел пять повторении с угасанием, и с каждым разом все чаще и чаще оперант s.R:AB начал обретать все большую и большую силу, а оперант s.R0 угасать.
Когнитивные карты или факторы подкрепления?
Описывая первые дни тренировок хомяков, я отметил, что такое сложное поведение можно объяснить через факторы подкрепления — каждый поворот в лабиринте, после которого открывается новое пространство для исследования является отрицательным подкреплением. Определенный путь в лабиринте, который в итоге приводит хомяка к выходу (основному отрицательно подкрепляющему стимулу) обусловливается в цепочку оперантов. И в этом разделе я подробно опишу данную точку зрения и результаты опытов в качестве её подкрепления.
Итак, как уже читателю известно из обзора литературы, когнитивные психологи предполагают, что у грызунов образуются когнитивные, навигационные карты местности, в которой они находятся. Вдобавок, современные когнитивные психологи считают, что организм, находясь в определенных условиях, не реагирует на стимулы напрямую, а сначала разглядывает, «перерабатывает» ситуацию, «оценивает» происходящее, и лишь затем «выбирает» как отреагировать. Через опыты, которые я сейчас буду описывать, читатель поймет, что это не так. На рис. 6 читатель может увидеть, как выглядит гипотетическое объяснение ныне изучаемого поведения, предлагаемое мною на основе анализа поведения.
После того, как я закончил наблюдать за процессами угасания у хомяка 2, я решил слегка изменить лабиринт 1, и наблюдать за поведением хомяка 1. Из лабиринта я вынул одну книгу, тем самым открыв новый проход, через который открывается более которкий путь к выходу (см. на рис. 7 слева). Я запустил хомяка 1 дважды в этот лабиринт, но он пробежал именно через тот путь, через который был обусловлен ранее (оба раза за 6 секунд). Затем я вернул книгу на место, и вынул иную из другого места (см. на рис. 7 справа). Теперь открылся новый проход, путь до выхода стал более коротким. К тому же место оказалось таким, что было трудно не приметить. Однако хомяк все равно пробежал через выученный путь, на этот раз за 8 секунд. Почему хомяк не остановился в трех случаях и не подумал: «А может попробовать пройти через новый проход?» Почему хомяк не остановился и не «обработал» обстановку? Куда исчезли его «когнитивные карты»? Я считаю, что эти три попытки вполне достаточны для того, чтобы показать, что поведение грызунов зависит от прошлого жизненного опыта, что объясняется через факторы подкрепления, а не от неких воображаемых «когнитивных карт», «памяти» и так далее.
Переобусловливание
Я не остановился на этом и решил переобусловить хомяка 1. На этот раз я помещал его в лабиринт 1, но теперь начальная точка была на месте, где раньше был выход, а там, где раньше была начальная точка, был выход. То есть старт и финиш поменялись местами. Хомяк обусловился выбегать через новый выход за четыре повторения. (Таблицы с результатами данных показаны на рис. 8). После переобусловливания, (которое видно на рис. 8), я решил снова проверить, как хомяк поведет себя если уберу где-то книгу и сделаю путь короче. После четырех повторений обусловливания я убрал книгу из места, которое обозначено кружком на рис. 8. Я поместил в этот лабиринт хомяка 1 дважды, и в эти два повторения он опять пробежал через тот путь, через который был обусловлен пробегать. Первое повторение за 18 секунд, второе заняло всего 6 секунд, то есть, сила операнта наивысшая.
Пространственное ориентирование. Воспроизведение опыта Ричи Б. Ф.
Этот опыт провел Ричи Б. Ф., и об этом я подробно написал в главе обзор литературы. Ричи проверял, как обусловленные крысы отреагируют на определенные изменения в окружающей среде. Пытаясь воспроизвести подобный опыт с хомяками, я построил площадку (см. рис. 9), и помещал в нее хомяков (площадку построил на той же платформе, на которой проводил опыты).
Хомяки помещались по отдельности в точку А, и каждого из них я обусловливал выходить через определенный выход. Когда хомяк 1 помещался в площадку, выход В2 был закрыт, а В1 был открыт. А когда хомяк 2 помещался, я закрывал выход В1 и открывал выход В2. Данные об обусловливании написаны в таблице на рис. 9.
Итак, как видно на таблице, обусловливание прошло успешно (сила операнта стала высокой у обоих хомяков уже после третьего повторения). Количество времени третьего повторения хомяка 2 не записано, потому что я потерял видео, где это было снято. После обусловливания, как и в опыте Ричи, я перевернул платформу на 180 градусов, закрыл проход, который вел к тем выходам, и добавил новые проходы (см. рис. 10).
Если я не ошибаюсь, то в этих условиях, в опыте Ричи, после обусловливания на первой площадке, крысы помещались в точку А (на новой площадке), но бежали не к тому выходу, к которому они раньше обусловились, а в противоположную сторону (Если раньше они обусловились выбегать через В1, то теперь, после разворота площадки, они будут выбегать через В2, потому что этот выход ближе к той стене, к которой был близок выход В1 до разворота площадки). По словам Толмана, это показывало, что у крыс сформировались когнитивные карты в отношении стен комнаты, но не по отношению к платформе. Поскольку я не воспроизвел опыт точь-в-точь как у Ричи, и не знаю подробно о переменных, влияющих на результаты его опыта, я не буду это как-то опровергать, и поэтому лишь опишу то, что происходило в моем опыте, и позволю читателю самому сделать выводы.
Когда я поместил хомяка 1 в новую площадку, в точку А (см. на рис. 10), он вышел в большую площадь, и действительно направислся в ту сторону, где раньше был В1 (ныне на этой стороне В2). Но после этого, ничего необычного не происходило, я наблюдал лишь обычное поведение, так называемых, «проб и ошибок». Хомяк просто исследовал площадку, которая была обставлена книгами, а затем случайным образом нашел выход В1 (после 56 секунд). Далее, соответсвенно, как видно в таблице на рис. 10, пошел простой процесс обусловливания. На шестом повторении хомяк наткнулся на одну книгу, которую чуть не уронил, и это событие слегка испортило ход опыта, так как слегка подкрепило врожденные, угасшие операнты s.R:AB. После этого понадобилась минута для того, чтобы хомяк вышел через проход В1.
Далее я поместил на площадку хомяка 2, и к моему удивлению он не пошел в сторону В1, как ожидалось, судя по описаниям опыта Ричи, а в напраивился в сторону нынешнего В2. После этого вновь наблюдалось простое поведение «проб и ошибок». Хомяк тоже наткнулся на книгу, которую чуть не свалил, и поэтому первое повторение получилось долгим. После второго повторения я решил закончить опыт, ибо ничего особого, что подкрепляло бы выводы Толмана, я не увидел. На этом я закончил свои эксперименты.
Резюме
- В нервной системе грызунов не создаются «когнитивные карты». Проходы и открытие нового пространства (ощущаемого лапками, в первую очередь) являются для них подкрепляющими стимулами. Чем сильнее к этому влечение, тем нагляднее это видно. (Скорее всего, такое влечение у хомяков сильнее, чем у крыс).
- Если хомяк «научается» быстрее выбегать из лабиринта, а затем он помещается в новый лабиринт, и выбегает оттуда быстрее, чем если бы он помещался туда впервые, то это не значит, что у него образовалась «когнитивная карта». Это происходит поскольку раньше, в условиях лабиринта, усилилось поведение s.R0., а поведение «вскарабкивания и рытья» (s.R:AB) угасло. Поэтому, если этот хомяк в будущем попадет почти в любой похожий лабиринт, то сначала он будет бегать по всем доступным проходам, а лишь затем, если он не найдет выход, включаться, так сказать, врожденные операнты «вскарабкивания и рытья».
- Сложное поведение в лабиринте является цепью оперантых рефлексов, каждый из которых подкрепляется, при условии, что последнее звено цепи это выход из лабиринта.
- Для изучения и прогноза поведения, необходимы точные, количественные описания всех увиденных независимых переменных (стимулы: вызывающие, различительные, подкрепляющие. Которые могут быть в роли антецедентов или постцедентов) и зависимых переменных (реакций, операнты, поведение), а не обобщенные, неопределенные слова с расплывчатым смыслом (например, «память», «душа», «разум», «характер», «выбор», «воля», «ожидание», «желание», «карты», «бесы», «демоны», «злые силы» и и т. д. и т. п.) Это не касается лишь хомяков, или грызунов, но, скорее, всех живых существ в целом.
Литература:
- История зарубежной психологии 30-е-60-е годы ХХ века. Тексты. «Необихевиоризм, Скиннер Б. Оперантное поведение» стр. 60–97, «Когнитивная психология» стр. 117–131. Москва: Издательство Московского университета (1986)
- Павлов И. П. Избранные сочинения: Физиология и психология при изучении высшей нервной деятельности животных. Стр. 176–196. Москва: Издательство «Э. (2015)
- Скиннер Б. Ф. Поведение Организмов. Перевод с англ. — Зуев А. Б. Москва: Оперант (2016)
- Скиннер Б. Ф. Происхождение когнитивного мышления. American Psychologist, 44 (1), (1989) 13–18. (Перевод на русский — Behaviorist_socialist) http://behaviorist-socialist-ru.blogspot.com/2014/09/1.html
- Catania A. C. Thorndike’s Legacy: Learning, Selection and The Law of Effect. Journal of the Experimental Analysis of Behavior, Vol. 72, N. 3, (1998) 425–428.
- Skinner B. F. What is the Experimental Analysis of Behavior? Journal of the Experimental Analysis of Behavior, Vol. 9, N. 3, (1966) 213–218.
- Thorndike E. L. Some Experiments on Animal Intelligence. Science, Vol. 7, No. 181, (1898) 811–824.
- Tolman E. C. Cognitive maps in rats and man. The Psychological Review, Vol. 55, No. 4, (1948) 189–208.
- Weisberg S. M. and Newcombe N. S. Cognitive Maps: Some People Make Them, Some People Struggle (2018) https://doi.org/10.1177/0963721417744521
[1] Закон Эффекта – Если реакций производят удовлетворительное воздействие в определенной ситуации, то в будущем вероятность возникновения этих реакции в этой ситуации повышается, а вероятность появления реакций, которые производят неприятное воздействие в этой ситуации, понижается. [Gray, Peter. Psychology, Worth, NY. 6th ed. Pp 108-109]).
[2] Это слово нужно прояснить. Оно не означает некую «универсальную», поставленную организмом «цель» для удовлетворения своих нужд, а лишь зависит от контекста случая.
[3] Скиннер помещал голодных крыс в специальный ящик, где наблюдался лишь один единственный основной оперант, который был предметом изучения – нажатие на рычаг. На этом операнте Скиннер обнаружил многие закономерности и особенности поведения, такие как: сила операнта, периодическое обусловливание, угасание, различительные стимулы, наказание, влечение и прочее.
[4] Кривая угасания – если поведение подкреплялось множество раз, но за ним больше не следует положительного подкрепления, то это поведение начинает постепенно «исчезать», его частота снижается. Организм совершает все меньше реакций, и кривая на графике становится более горизонтальной.
[5] Периодическое подкрепление, – пример из книги Скиннера – крыса обусловлена получать шарик пищи каждый раз, когда она нажимает на рычаг. Затем крыса получает шарик пищи лишь после определенного количества времени или реакций. Такое происходит в течение долгого времени и данное поведение (нажатие на рычаг) в данных условиях становится очень устойчивым.
[6] Инсайт – умственное явление, суть которого в неожиданном, отчасти интуитивном прорыве к пониманию поставленной проблемы и внезапном нахождении ее решения. (Взято из википедии).
[7] Общая семантика – прикладная эмпирическая научная дисциплина, разработанная Коржибским А. в 20-е годы двадцатого века, главным предметом исследования которой являются: 1. воздействие слов и языка на поведение человека, и 2. процессы восприятия действительности и т.д.
[8] Закон рефрактерного периода — сразу после вызывания некоторых рефлексов их сила понижается (иногда до нулевой величины). За время последующего бездействия она возвращается к исходному значению. [Скиннер, 1938]