Double loop learning
¿Por qué participas en retrospectivas y análisis postmortem? ¿Alguna vez profundizas más allá de la punta del iceberg?
Este artículo es una continuación de la entrega sobre sistemas de doble loop. Si bien no es imprescindible haberlo leído para entender lo que voy a contar hoy, creo que puede ser interesante que le eches un vistazo antes, ya que aporta un marco útil para lo que exploraremos aquí.
Si estás suscrito a esta newsletter, es muy probable que hayas formado parte de equipos que realizan retrospectivas con regularidad, por ejemplo, al final de cada sprint. O que llevan a cabo análisis postmortem después de incidentes. Seguramente también mantienes reuniones periódicas 1:1 con tu manager o reports.
También asumo que compartimos un interés común por entender las razones detrás de nuestras prácticas, metodologías, etc. ¿Alguna vez te has detenido a reflexionar por qué participas, o si como líder promueves estas ceremonias?
Voy a seguir asumiendo: probablemente estemos de acuerdo en que todas estas ceremonias constituyen feedback loops. Son mecanismos para obtener retroalimentación periódica que nos permiten «medir» la brecha entre un estado actual y una meta, e identificar acciones que puedan ayudar a reducirla.
Sistemas orientados a alcanzar objetivos
Este tipo de mecanismos, orientados a alcanzar objetivos, buscan equilibrar el estado actual con un estado deseado. De hecho, representan una de las estructuras arquetípicas fundamentales en la dinámica de sistemas.
La estructura orientada a alcanzar objetivos comienza con un [estado deseado] y un [estado actual], cuya diferencia genera un [gap].
El [gap] actúa como un impulso para la [acción], que tiene como objetivo mover el [estado actual] en dirección al [estado deseado], reduciendo así el [gap]. A medida que el [gap] se reduce, la [acción] también disminuye, aunque el [estado actual] sigue acercándose al [estado deseado]. Cuando el [estado actual] iguala al [estado deseado], el [gap] es cero y no se requiere más acción.
Esta estructura demuestra un comportamiento orientado a objetivos, que es una característica emergente de la estructura en su conjunto. Ninguno de los elementos por separado exhibe este comportamiento.
Cualquier situación en la que se toma una [acción] para mover algo hacia un [estado deseado] constituye una estructura orientada a alcanzar objetivos. Estas estructuras pueden tener muchos elementos, pero lo que las caracteriza es que siempre hay un número impar de restas o influencias opuestas en el bucle.
Gene Bellinger. Goal Seeking
Pero la pregunta clave es: ¿es suficiente con identificar ese gap y definir acciones?
Paremos de filosofar por un momento y aterricemos esto en un ejemplo concreto.
Al finalizar el sprint, haces una retrospectiva y se detecta que prácticamente no se ha podido avanzar en lo planificado porque surgió mucho trabajo no previsto, principalmente bugs.
El gap identificado es la brecha entre la expectativa de avanzar en lo que se consideraba el foco del sprint y la realidad que vivió el equipo.
Para reaccionar a ese gap, el equipo propone algunas acciones: asignar a una sola persona para gestionar cualquier interrupción. Esta persona se encargará de atender las demandas emergentes, permitiendo que el resto del equipo mantenga el foco en lo planificado. Con esta medida, el objetivo es proteger el foco del equipo y avanzar hacia la meta del sprint.
Aunque este ejemplo sea hipotético, lo cierto es que en Audiense creamos hace 10 años este rol rotativo, al que llamamos the monkey, por entonces no tuvimos en cuenta todo lo que veremos a continuación y tardamos bastante tiempo en enfocarnos en el problema real.
Esto no está mal del todo. El equipo, en su proceso de mejora continua, ha identificado impedimentos y ha tomado medidas para mejorar. De hecho, en las siguientes retrospectivas se evaluará si estas acciones han tenido el efecto deseado y, de no ser así, se propondrán otras.
Single loop learning
Esta forma de enfocar una retrospectiva se enmarca en lo que se conoce como single loop learning (aprendizaje de un solo bucle). Consiste en responder a discrepancias o errores ajustando las acciones sin cuestionar los valores, normas o estrategias subyacentes. Es un proceso reactivo que busca mantener el sistema operando dentro de su marco actual.
Ya en la entrega sobre sistemas de doble loop vimos cómo la combinación de dos bucles, uno que requiere más esfuerzo y otro más económico, puede ayudarnos a perseguir una meta de forma eficiente.
El aprendizaje de un solo bucle es nuestra forma económica de operar en la búsqueda de la mejora continua. Es óptimo en situaciones donde estamos bien entrenados, las soluciones son conocidas y existen mejores prácticas de referencia.
No considero que este sea un enfoque inferior. El hecho de que sea reactivo y se centre en eventos y patrones visibles no tiene por qué ser algo negativo, peor es no cuestionar nada. En muchos casos, este tipo de aprendizaje es suficiente para mantener el sistema funcionando de manera efectiva dentro de sus parámetros actuales, pero no es adecuado para todas las situaciones.
Los seres humanos producen acción activando diseños almacenados en sus cabezas (mente/cerebro) que, al ser activados, generan las acciones necesarias para implementar sus intenciones. Los seres humanos también desarrollan diseños para evaluar en qué medida logran lo que pretendían producir. Si logran lo que pretendían, hay una correspondencia entre las intenciones y las acciones. Si no lo logran, hay una discrepancia.
Para realizar evaluaciones válidas sobre su eficacia, los seres humanos deben detectar las discrepancias y corregirlas. En el núcleo de actuar de manera efectiva está el aprendizaje. El aprendizaje también ocurre si las acciones generan un resultado nuevo por primera vez.
— Smith, Ken G. and Hitt, Michael. Great minds in management: the process of theory development
Muchas veces esta forma de aprendizaje no es suficiente, ya que operar constantemente en este modo nos lleva a abordar problemas sistémicos con soluciones superficiales, que terminan por alimentar y agravar el problema subyacente como ya hemos visto con la trampa de la adicción al parche.
Double loop learning
Cuando enfrentamos problemas que parecen imposibles de resolver, tendemos a redoblar esfuerzos sin detenernos a reflexionar sobre las razones fundamentales de nuestras acciones. Nos quedamos atrapados en los límites de cómo entendemos el problema, repitiendo los mismos patrones una y otra vez, sin lograr mejoras ni resultados diferentes. Es como avanzar sin rumbo.
En estos casos, el double loop learning (aprendizaje de doble bucle) se convierte en una herramienta imprescindible. Aunque representa el enfoque más exigente, es también el que permite abordar problemas desde su raíz y generar cambios profundos y sostenibles.
Este enfoque implica cuestionar los supuestos fundamentales y las normas que sustentan las decisiones. Es más costoso porque exige una reflexión profunda, que a menudo lleva a replantear objetivos, estrategias o valores. Por eso no es viable aplicarlo constantemente, pero su capacidad para romper círculos viciosos lo hace esencial cuando las soluciones habituales dejan de ser efectivas.
El concepto de double loop learning proviene del trabajo de Chris Argyris y Donald Schön y es una teoría clave en la mejora organizacional y en la forma en que los individuos y grupos abordan problemas complejos.
El aprendizaje de doble bucle se refiere a la distinción entre el aprendizaje que mantiene un sistema de comportamiento operando dentro de un campo de constancia y el aprendizaje que cambia lo que el sistema busca lograr o mantener constante. Está relacionado con la distinción entre cambio de primer orden y de segundo orden. El énfasis en el aprendizaje en lugar del cambio destaca los procesos mediante los cuales los miembros del sistema buscan mejorar su funcionamiento. El aprendizaje de doble bucle es un concepto importante para la investigación-acción porque se centra en lo que se necesita para que las personas y los sistemas realicen cambios fundamentales.
— Robert W. Putnam. Double-Loop Learning
Aplicaciones
Nada de esto es nuevo en esta newsletter; ya hemos explorado varios enfoques basados en ir más allá de lo superficial.
Slow systems thinking con el modelo del iceberg, es uno de ellos. Es una herramienta muy efectiva para trascender los eventos, tendencias y patrones, y centrarnos en el por qué: qué ha influido en estos patrones y qué modelos mentales nos llevan a operar de esta manera.

Otro enfoque relevante es el Pensamiento de Primeros Principios (First Principles Thinking), que vimos cuando reflexionamos sobre ¿por qué hacer reuniones 1:1s?. Es una forma de cuestionar supuestos básicos para descubrir las razones fundamentales detrás de nuestras acciones.
También están técnicas como Los cinco ¿Por qué?, donde iterativamente nos preguntamos el por qué de una discrepancia observada, hasta llegar a capas más profundas y fundamentales en el iceberg.
Además, he dedicado varios ensayos al espacio del problema vs el espacio de la solución. Muchas de las herramientas y técnicas exploradas en ese contexto como la disolución de problemas mediante inversión, se basan en el double loop learning, ya que buscan ir más allá de las soluciones más inmediatas o superficiales.
Continuando con el ejemplo
Volviendo al ejemplo de la retro, un caso de aprendizaje de doble bucle habría sido cuestionar por qué salen tantos bugs.
En un primer nivel, podrían surgir soluciones como invertir más en QA, mejorar los entornos de staging, dedicar más tiempo a probar antes de desplegar o involucrar a más personas en las pruebas. Estas medidas probablemente reducirían el número de bugs, pero también el flujo de valor, pues aumentar el costo del proceso podría contribuir al círculo vicioso de la burocracia.
Un análisis más profundo podría llevarnos a evaluar nuestras prácticas de desarrollo: ¿hacemos suficientes tests? ¿Son lo suficientemente buenos? ¿Por qué no lo son? ¿Es porque no escribimos código fácil de testear? ¿Por qué? ¿Es nuestro sistema demasiado complejo y frágil? ¿Por qué? Y así sucesivamente, hasta llegar a las raíces del problema.
Pero un nivel aún más allá sería cuestionar nuestros modelos mentales. Esto podría implicar salir de nuestra zona de confort y explorar otras formas de plantear el desarrollo de producto, como por ejemplo, Lean. No es casualidad que Mary y Tom Poppendieck propongan que Lean es una mentalidad, dedicando la introducción de su libro The Lean Mindset: Ask the Right Questions a explicar qué es un mindset y cómo funciona, apoyándose en la teoría de proceso dual, que ya hemos explorado en esta newsletter.
En términos generales, operamos en modo piloto automático. Si surgen circunstancias inusuales, cambiamos del piloto automático al modo manual. Es en este modo manual donde desarrollamos o modificamos nuestros modelos mentales. Para cambiar un modelo mental establecido, necesitamos pasar una buena cantidad de tiempo en modo manual, con el Sistema 2 plenamente activo.
— Mary Poppendieck, Tom Poppendieck. The Lean Mindset Ask the Right Questions
Este tipo de cuestionamiento puede llevarnos a promover cambios muy profundos en nuestras formas de trabajar. Cambios que, como mencioné en el último radar, requieren tirar de coraje para llevarse a cabo. Pero son precisamente estos cambios los que pueden transformar verdaderamente el sistema y romper patrones disfuncionales.
Concluyendo
Una vez más, hemos explorado dos formas de abordar los desviaciones de la meta: una lenta, más profunda y transformadora, pero que requiere un mayor esfuerzo y coste; y otra más rápida, que permite operar eficientemente la mayor parte del tiempo sin renunciar a la mejora continua.
Ambos enfoques son necesarios y se complementan. Mientras el aprendizaje de un solo bucle nos ayuda a mantenernos operativos y mejorar en el corto plazo, el aprendizaje de doble bucle nos impulsa a cuestionar nuestras bases y lograr cambios sostenibles a largo plazo.
El aprendizaje de doble bucle puede ser desconcertante porque obliga a las personas y organizaciones a salir de su zona de confort y a repensar sus supuestos básicos. Sin embargo, es esencial para el crecimiento y la adaptación a largo plazo. — Robert W. Putnam. Double-Loop Learning
Es fundamental darnos el espacio necesario para aplicar el esfuerzo que requiere el aprendizaje de doble bucle. La Teoría de Restricciones (TOC) plantea que intentar mantener un sistema funcionando a su máxima capacidad es un antipatrón, ya que, lejos de optimizar el flujo, genera cuellos de botella y sobrecarga en las partes críticas del sistema, lo que reduce la eficiencia global y amplifica las interrupciones.
Pero las implicaciones van más allá de la eficiencia. Cuando operamos continuamente al 100%, nos quedamos sin margen para la reflexión y el ajuste estratégico, dejando como única opción trabajar desde un enfoque de single loop learning. Actuando en piloto automático, con el sistema 1 y el elefante al mando y reaccionando de manera caótica cada vez que descubrimos lo alejados que estamos de nuestras metas reales.
Bola extra
Se acerca el fin de año, y algunos tenéis por tradición plantearos objetivos para el próximo. Un enfoque de double loop learning puede ser clave para enfocar los esfuerzos en lo que realmente importa, en lugar de crear propósitos de año nuevo que se rompen en febrero.
Muchas personas comienzan el proceso de cambiar sus hábitos enfocándose en lo que quieren lograr. Esto nos lleva a hábitos basados en resultados. La alternativa es construir hábitos basados en la identidad. Con este enfoque, empezamos por centrarnos en quién queremos llegar a ser.
— James Clear
Lecturas recomendadas
Double Loop Learning in Organizations — Chris Argyris
Double-Loop Learning — Robert W. Putnam
Double-loop vs single-loop learning — Sheril Mathews
Double-Loop Learning — Pat Kua
Great minds in management: the process of theory development — Smith, Ken G. and Hitt, Michael.
Identity-Based Habits: How to Actually Stick to Your Goals This Year — James Clear