El sistema de recompensa del cerebro ¿por qué nos comportamos como nos comportamos?

By Juan Carlos López - 20:16

Ortega y Gasset decía "lo que nos pasa es que no sabemos lo que nos pasa, por eso nos pasa lo que nos pasa". Para conocer un poco mejor el por qué de nuestro comportamiento, se hace imprescindible analizar la base del mismo, para lo cual es necesario repasar, entre otras cosas, el sistema de refuerzo del cerebro. Éste, nos puede dar buena parte de las respuestas acerca de nuestras motivaciones, el aprendizaje, la memoria, la atención, la toma de decisiones, la inhibición, las emociones y, en general, de nuestra conducta. Aquí también estaría la explicación de las teorías del aprendizaje por condicionamiento clásico y operante (asociación de estímulos, refuerzos, castigos,...), las conductas adictivas y otras psicopatologías, síntomas de DCA de las áreas implicadas, así como el comportamiento característico de los adolescentes.

Un refuerzo supone un objetivo, el cual evoca respuestas de acercamiento y aumenta la frecuencia de la conducta. Los resfuerzos producen sentimientos subjetivos de placer, generando emociones positivas, de tal manera, que los estímulos que los preceden, por asociación, quedan marcados con un valor motivacional positivo.

Las personas buscamos continuamente refuerzos, a los que les tenemos asignados un valor positivo, a la par que evitamos situaciones aversivas, con un valor negativo. Para ello, debemos extraer la información reforzante de una gran variedad de estímulos y situaciones: la persona debe detectar y percibir los estímulos reforzantes y los estímulos que les preceden, tiene que evaluarlos y darles un valor, tiene que valorar lo predecibles y accesibles que son y los gastos necesarios para su consecución (relación coste-beneficio), inhibir los comportamientos que lo alejen de él y, todo ello, en base a la experiencia previa de la persona. La detección de un estímulo que precede la aparición de un refuerzo determinado puede generar un estado de expectación en el individuo, el cual persiste durante varios segundos hasta que el estímulo reforzante es administrado. En ocasiones, cometemos errores de predicción, no llegando a producirse el refuerzo que esperábamos, o bien, al contrario, produciéndose un refuerzo que no esperábamos.

Los estímulos reforzantes pueden mantener conductas y prevenir su extinción, estableciendo un sistema de valores y de referencia en la toma de decisiones. En general, existe preferencia por los refuerzos que se obtienen de forma inmediata sobre los que se demoran en el tiempo, por los probables sobre los poco probables, por los refuerzos que requieren poco esfuerzo para su consecución sobre los más dificultosos de lograr, así como por los que son de mayor magnitud sobre los menos valorados.

Los sistemas de refuerzo son muy importantes para la vida misma, procurando el bienestar y la superviviencia, motivando conductas que den respuesta a los desequilibrios internos (hambre, sed,...), así como dirigir nuestro comportamiento hacia estímulos externos que suponen un incentivo en sí mismos.

Existen estructuras cerebrales capaces de detectar y percibir un refuerzo, detectar  los estímulos que predicen su llegada, así como de detectar errores de predicción. Estas estructuras son las relacionadas, fundamentalmente, con el sistema dopaminérgico.

Las vías dopaminérgicas parten desde la parte superior del mesencéfalo, en concreto, desde el área tegmental ventral y la sustancia negra.


 Existen cinco vías dopaminérgicas:

  • Vía nigrostriada, que parte desde la sustancia negra del mesencéfalo al estriado dorsal, formando parte del sistema nervioso extrapiramidal (en verde).
  • Vía mesolímbica, que parte desde el área tegmental ventral al núcleo accumbens (en rojo).
  • Vía mesocortical, que parte desde el área tegmental ventral a diferentes regiones de la corteza prefrontal (rojo).
  • Vía tuberoinfundibular, que parte del hipotálamo a la hipófisis anterior, controlando la secreción de prolactina.
  • Una quinta vía, de la que aún no está clara su función, que procede de diferentes localizaciones, como la sustancia gris periacueductal, el mesencéfalo ventral, diferentes núcleos hipotalámicos y el núcleo parabraquial lateral y que proyecta al tálamo.
Esta estructura difusa no puede procesar y almacenar información detallada y compleja; pero sí es capaz de coordinar respuestas orientadas hacia los estímulos salientes y los refuerzos. Estas respuestas, a través de la experiencia, dan lugar a un aprendizaje, que se asocia a un refuerzo, a los estímulos que le preceden y a las acciones que el individuo realiza para la consecución del refuerzo. Las neuronas dopaminérgicas del mesencéfalo activan los procesos de refuerzo, colaborando en el aprendizaje de secuencias conductuales por medio, sobre todo, de las funciones asociativas del sistema límbico. Este aprendizaje se consolida y almacena en la memoria, en relación a cambios en los patrones y en la fuerza sináptica de conexiones excitatorias glutamaérgicas y conexiones inhibitorias GABAérgicas.

Dentro de la red del sistema dopaminérgico se incluyen estructuras clave como la corteza cingulada anterior, la corteza prefrontal orbital, medial y dorsal, el estriado ventral, el globo pálido ventral, el tálamo, el hipocampo, la amígdala, la habénula lateral, las neuronas dopaminérgicas mesencefálicas y otros grupos de neuronas del núcleo pedunculopontino tegmental y los núcleos de rafe.

Las neuronas doparminérgica del área tegmental ventral reciben inervaciones excitatorias de la corteza prefrontal, núcleo tegmental dorsolateral y del hipotálamo lateral. Por contra, son inhibidas a través de proyecciones GABAérgicas provenientes del núcleo accumbens y del globo pálido ventral. Aproximadamente, el 35% de la neuronas del área tegmental ventral son GABAérgicas, proyectándose también hacia el núcleo accumbens y el prefrontal, teniendo un papel fundamental en la inhibición.


Existen sustratos relativamente independientes según la clase de situación reforzante.

CORTEZA PREFRONTAL


Las áreas de Broadman prefrontales relacionadas con el refuerzo son:

  • Orbitofrontal: áreas 11, 12, 13 y 14. Tanto los refuerzo de tipo sensorial como los abstractos  activan el orbitofrontal, siendo las áreas posteriores las que se activan con los refuerzos sensoriales, y las anteriores con los refuerzos abstractos. Los castigos activan las regiones más laterales del orbitofrontal. Por tanto, esta área puede discriminar entre refuerzo y castigo.
  • Ventromedial: 10, 11 y 32. Se activa ante refuerzos primarios y secundarios. Su activación también está asociada con el resultado satisfactorio del refuerzo, descendiendo su activación si no se obtiene el resultado esperado. estas respuestas son mayores con refuerzos abstractos. También se activa en relación a la magnitud y probabilidad de ocurrencia del refuerzo esperado.
  • Cingulado anterior (24, 25 y 32) y Dorsolateral (9 y 46). Podrían actuar de manera conjunta y complementaria para comparar diferentes opciones y elegir, monitorizando las respuestas en situaciones de conflicto potencial (valores similares de las opciones), consiguiendo la opción más valiosa para la persona.

Lesiones en la corteza prefrontal reducen la sensibilidad a las consecuencias negativas de las acciones, haciendo a las personas insensibles a las señales de riesgo o seguridad de las elecciones que van tomando.

ESTRIADO VENTRAL

El estriado ventral está compuesto por el núcleo accumbens, la región ventromedial del caudado y el putamen rostroventral. Esta área se activa cuando se expone a reforzadores, tanto primarios como secundarios. La magnitud del refuerzo anticipado aumenta la activación del núcleo accumbens y la parte medial del caudado. A mayor magnitud mayor activación de estas áreas. Ante los castigos anticipados no se activa el núcleo accumbens; pero si la parte medial del caudado. Otros aspectos, como la probabilidad de que ocurra, o analizar los costes-beneficios, provocan la activación del putamen rostroventral.

Antes hemos comentado que existe preferencia por los refuerzos con demoras temporales cortas y que requieren poco esfuerzo. Pues bien, cuando la demora para obtener el refuerzo es muy corta el estriado ventral se activa, disminuyendo a medida que aumenta la demora. Es la corteza prefrontal la que se muestra sensible a la demora de los estímulos futuros. Cuando la consecución de un refuerzo requiere esfuerzo se reduce la activación del putamen rostroventral.

Ante refuerzos impredecibles la activación del núcleo accumbens aumenta. La anticipación de un refuerzo aumenta la actividad del estriado ventral, mientras que la consecución de un resultado no reforzante la reduce. Mientras el caudado medial y el núcleo accumbens se activan durante la anticipación de un refuerzo, el putamen rostroventral se desactiva en respuesta de la obtención de un resultado no reforzante. El putamen rostroventral reacciona ante el error de predicción del refuerzo.

Esta estructura está directamente relacionada con las sensaciones de euforia y bienestar tras consumo de alcohol, cocaína y anfetaminas.


AMÍGDALA

La amígdala parece ser importante en el procesamiento de los aspectos emocionales del refuerzo, incluyendo su valencia positiva o negativa, así como su valor relativo. Algunas de las funciones llevadas a cabo por la amígdala son realizadas conjuntamente con la corteza orbitofrontal, posibilitando la toma de decisiones más ventajosas, basándose en el valor actual de los resultados asociados a dichas claves o estímulos. Otra de esas funciones conjuntas es la actualización de los valores de los resultados esperados. Una vez que la amígdala completa esa actualización, la corteza orbitofrontal almacena el valor del resultado de los refuerzos esperados. aumentando al máximo los resultados positivos y disminuyendo al mínimo los negativos, guiando la toma de decisiones mediante el valor de los resultados obtenidos. La activación de la amígdala disminuye cuando un estímulo que previamente resulta reforzante para el individuo pierde su valor.

NEURONAS DOPAMINÉRGICAS MESENCEFÁLICAS

Las neuronas dopaminérgicas del mesencéfalo parecen constituir el nexo de unión entre el estriado ventral y el estriado dorsal, constituyendo una vía estriadonigroestriada, permitiendo la transferencia de información del estriado ventral al estriado dorsal durante el aprendizaje y la formación de hábitos en situaciones relacionadas con el refuerzo. Esto parece tener un gran importancia para la predicción y para el error en la predicción del refuerzo. Las neuronas dopaminérgicas regulan los niveles de concentración de dopamina, bien manteniendo un nivel basal para permitir el funcionamiento normal de la red (modo tónico), bien aumentando o disminuyendo bruscamente su tasa de disparo de concentración de dopamina (modo fásico). Entre las neuronas dopaminérgicas mesencefálicas, existen grupos ubicados en la sustancia negra ventromedial y la zona lateral del tegmental ventral, que aumentan su actividad en presencia de estímulos que predicen el refuerzo, el refuerzo es mayor de lo esperado o cuando un estímulo es inesperado (ya sea reforzante o aversivo); y dismuyen su actividad cuando el refuerzo es peor de lo que había predicho, o cuando se trata de un estímulo aversivo (reaccionan ante el valor positivo o negativo del estímulo, valor motivacional), provocando el acercamiento o la evitación. Estas neuronas dirigen sus señales hacia el estriado dorsal. Por otro lado, hay otro grupo de neuronas, las situadas en la sustancia negra dorsolateral, que se activan ante la presencia del estímulo (saliencia motivacional), independientemente de si es reforzante o aversivo, como señal que da importancia a la presencia de ese estímulo (a mayor relevancia, sea positiva o negativa, mayor respuesta). Estas neuronas dirigen sus señales tanto al estriado dorsal, como al estriado ventral, la amígdala y la corteza prefrontal. En definitiva, estas neuronas, parecen ser capaces de detectar la presencia de estímulos reforzantes, produciendo ráfagas de actividad hacia el estriado, la corteza cingulada y la corteza prefrontal, facilitando con ello los procesos de aprendizaje y memoria para los estímulos asociados, función esta en la que también es fundamental el hipocampo en su conexión con el tegmental ventral.

Los estímulos sensoriales de alta intensidad, así como los sorprendentes e inesperados, también provocan ráfagas de excitación en las neuronas dopaminérgicas mesencefálicas, reflejando el grado en el que capta la atención de la persona. También ocurre cuando el estímulo es de baja intensidad pero resulta relevante por su novedad. Cuando el estímulo se vuelve familiar baja la intensidad de la reacción (habituación).


TÁLAMO

Parece que la función del núcleo dorsomedial del tálamo no es codificar información relacionada con el refuerzo, sino que su actividad refleja un estado de activación general (arousal). La activación del núcleo dorsomedial del tálamo se da ante refuerzos primarios y secundarios; pero también se da en la anticipación del castigo, por lo que no es específica del refuerzo. El tálamo mantiene conexiones bidireccionales con la corteza prefrontal (siendo más extensas las que van desde el prefrontal hacia el tálamo que a la inversa), así como conexiones unidireccionales en dirección al tálamo. Por dicho motivo, se piensa que el tálamo podría actuar como integrador de la información del refuerzo y de las áreas de asociación de la corteza prefrontal.

NÚCLEOS DE RAFE, HABÉNULA LATERAL Y NÚCLEO PEDUNCULOPONTINO TEGMENTAL

No sólo de dopamina vive el hombre. El sistema  serotonérgico de los núcleos de rafe parece jugar un papel esencial el procesamiento de la información reforzante, tanto en los refuerzos esperados como en los recibidos, producieéndose modificaciones en la actividad de las neuronas serotonérgicas. De ahí que, las personas con depresión, al ser tratadas con antidepresivos serotonérgicos experimenten cambios motivacionales y de experiencias placenteras. Por su parte, la habénula lateral responde ante la ausencia de refuerzo y se inhibe ante estímulos que predicen la aparición de un refuerzo. Por tanto, la habénula lateral sirve de modulador de las neuronas dopaminérgicas del mesencéfalo. El núcleo pedunculopontino parace tener un papeñ importante en relación al error de predicción del refuerzo.


En resumen, y tras ver la complejidad del sistema de refuerzo del cerebro, se puede concluir que aún queda mucho más por descubrir que lo que conocemos. Sabemos la estructura anatómica y cómo responden las diferentes partes involucradas en el refuerzo. También sabemos cómo nos puede influir en buena parte en nuestro comportamiento; pero no podemos quedarnos únicamente en la parte biológica del funcionamiento cerebral, ya que influyen multitud de factores ambientales individuales que den una explicación más completa del comportamiento humano.

Como decíamos al principio, detrás del sistema de refuerzo del cerebro, y del sistema dopaminérgico, se encuentran, además de la base biológica de teorías clásicas de la psicología, la explicación de comportamientos adictivos, tanto de sustancias tóxicas (nicotina, alcohol, cannabis, cocaína, anfetamina y sus derivados, opiáceos y alucinógenos), como las llamadas adicciones sociales, así como psicopatologías o daño cerebral donde los comportamientos impulsivos, eufóricos, desinhibidos o, por contra, apáticos, inexpresivos o de embotamiento, juegan un papel central. De ahí, que buena parte de los tratamientos psicofarmacológicos, tengan en el sistema dopaminérgico su diana principal, y buena parte de los tratamientos psicológicos en el control de contingencias (terapia de conducta) o, lo que es lo mismo, en el sistema de refuerzo. También resulta de interés el estudio del sistema de refuerzo en el comportamiento delictivo, ligado a un comportamiento deficitario en la obtención de refuerzos demorados, que requieren esfuerzo y que son poco probables.

Además, como psicólogo especialmente interesado en la adolescencia, decir respecto al sistema de refuerzo del cerebro que, durante la pubertad, como efecto de las hormonas sexuales (proceso que inicia la kisspeptina), se produce un desajuste entre el ritmo de desarrollo de la corteza prefrontal, y sus conexiones, y el circuito motivacional mesolímbico, incrementándose la capacidad de respuesta y excitabilidad de éste último, cuando la corteza prefrontal sigue su ritmo más lento en el desarrollo. Esto lleva a que se emitan conductas de búsqueda inmediata de recompensas de forma impulsiva y perseverante, como conductas de riesgo y búsqueda de sensaciones, en detrimento de la capacidad de inhibición y planificación, produciéndose un "retroceso" evolutivo respecto a edades previas a la pubertad.

La neuróloga norteamericana Frances Jensen afirma que, cuando ansiamos un helado, jugar o tener sexo, es posible que en realidad no queramos dulces, dinero ni sexo; sino dopamina. Quizá sea mucho decir, abstrayéndonos de connotaciones sociales, y de sus refuerzos más abstractos, según las preferencias de cada uno y de cada contexto que nos rodea. Lo que si está claro es que el sistema de refuerzo del cerebro está detrás de muchos comportamientos aprendidos, y de muchas de las reacciones que tenemos. Es de gran relevancia para los que nos dedicamos a intentar entender el comportamiento humano, tanto sano como patológico, el conocer las bases biológicas de la conducta, además de los aspectos cognitivos, emocionales, sociales e individuales, para poder poner en marcha estrategias de ayuda eficaces. En demasiadas ocasiones, en el llamado modelo biopsicosocial, a los psicólogos se nos olvida el peso de la parte biológica, y no será por no haberla tratado en profundidad en los planes de estudio de la carrera de psicología.



Una breve reseña histórica: El descubrimiento del sistema de recompensa del cerebro

En 1954, el psicólogo James Olds y el neurocientífico Peter Milner (ingeniero), que investigaban en el laboratorio que dirigía otro psicólogo ilustre (Donald Hebb, que propuso la teoría del aprendizaje neuronal), estaban investigando la formación reticular y su relación con la activación  (estructura y función descubiertas por el psicólogo Donald Lindsley en 1945) cuando, accidentalmente, al intentar implantar un microelectrodo en la formación reticular, con el fin de analizar el impacto de la estimulación eléctrica sobre el aprendizaje y la atención, descubrieron los centros implicados en el refuerzo (centros del placer). En una caja de Skinner analizaban como las ratas, a las que les habían colocado unos electrodos en la formación reticular, evitaban una estimulación que les resultaba aversiva. Sin embargo, entre ellas, observaron que una rata buscaba repetidamente la estimulación en el lugar dispuesto para ello. Lo que ocurrió fue que, por error, el electrodo estaba dispuesto en el área septal y no en la formación reticular como ocurría en el resto de ratas. La estimulación de los núcleos septales producía una sensación de placer muy intensa, buscando una y otra vez dicha estimulación aunque a la larga provoque consecuencias negativas. A partir de aquí abrieron un campo de investigación fundamental en el estudio de la emoción, la motivación y la memoria, entre otras cosas. Los núcleos septales tiene conexiones con el hipocampo, el hipotálamo, el epitálamo, la amígdala, la corteza prefrontal, el fórnix, el bulbo olfatorio y el área tegmental ventral, y tienen una función moduladora de los estados de alerta y las sensaciones placenteras. El sistema de recompensa es básico en las respuestas motivacionales y emocionales, que hacen que nos alejemos de los estímulos aversivos y nos acerquemos los estímulos agradables. Olds, es considerado uno de los padres de la neurociencia moderna, comenzando su carrera de la mano del gran psicólogo experimental Richard Salomon en Harvard, pasando a estar junto a Donald Hebb en McGill, y terminando su carrera en Caltech, centro de donde salieron figuras como los psicólogos Roger Sperry y Michael Gazzaniga, o el neurocientífico Joseph LeDoux. Se considera injusto que no se le otorgara el Premio Nobel.


<<Nuestra falta de puntería resultó ser un acontecimiento afortunado para nosotros. En un animal, el electrodo no dio en el blanco y aterrizó no en el sistema reticular del cerebro medio, sino en una vía nerviosa del rinencéfalo. Esto llevó a un descubrimiento inesperado>>.

James Olds



Para saber más y mejor:

  • Goldberg, E. (2002) El cerebro ejecutivo. Lóbulos frontales y mente civilizada. Barcelona: Crítica.
  • Jensen, F. E. (2015) El cerebro adolescente. Barcelona: RBA.
  • Oliva, A. (2007) Desarrollo cerebral y asunción de riesgos durante la adolescencia. Apuntes de Psicología 25, 3, 239-254.
  • Rains, G.D. (2004) Principios de neuropsicología humana. Madrid: McGraw Hill.
  • Redolar Ripoll, D. (2013) Sistemas de refuerzo en el cerebro. En D. Redolar Ripoll (Coord.) Neurociencia cognitiva. Madrid: Editorial Médica Panamericana. pp. 537-573.
  • Steinberg, L. (2015). Age of oportunity. Lessons crome the new science of adolescence. New York: Mariner Book.

  • Share:

You Might Also Like

0 comments