El palo de hockey (III): cómo se fabrica un palo de hockey

Como decía en las entregas anteriores, el palo de hockey se crea uniendo en la misma gráfica dos series de datos de distinta procedencia. La parte de la gráfica que nos interesa es la supuesta reconstrucción de la temperatura a partir de indicadores (proxies), datos que se presupone han sido influidos por la temperatura de su zona de origen:

¿Cómo reconstruir la temperatura a partir de esas series de datos, los «indicadores», que se cree que contienen información de temperatura? La idea más intuitiva es normalizar los valores para que todos tengan una varianza similar y luego hacer una media ponderada teniendo en cuenta el área del planeta que representa cada uno de esos indicadores. Pero lo que se hizo en MBH98/99 es un poco más complicado que una media ponderada. Y, como detallaremos, mucho más cuestionable.

La reconstrucción

El MBH98 usó 112 indicadores, cada uno de ellos con una extensión máxima de 581 años (1400–1980). Como no todos los indicadores estaban presentes en todos los años, los investigadores dividieron los 581 años de la reconstrucción en 11 tramos, que son los mostrados en la primera columna de la siguiente tabla, mientras que la segunda columna indica cuántos indicadores había disponibles para ese tramo:

El proceso de reconstrucción, por tanto, está basado en 11 cálculos independientes, cada uno de ellos para un tramo temporal diferente en el que se emplea el subconjunto de los 112 indicadores formado por los disponibles para esos años.

El proceso para el tramo i-ésimo es el siguiente:

  1. Se emplea un método multivariable para encontrar los coeficientes que mejor permiten reconstruir la temperatura medida (termómetros) en los años 1902-1980, que es el denominado «periodo de calibración«. La temperatura reconstruida para ese periodo es una combinación lineal de los indicadores.
  2. Con los coeficientes obtenidos en el paso anterior se reconstruye la temperatura en un periodo diferente del de calibración y del que también se tienen datos de termómetro, por ejemplo 1850-1901, que sería el llamado «periodo de validación«, y se comprueba si la temperatura reconstruida encaja con las medidas de termómetro en ese periodo. El resultado de esta comprobación es un test estadístico, como por ejemplo el R² de la reconstrucción y las medidas de termómetro. Si ese test no es superado, es decir, si no se alcanza una mínima significancia estadística se debe concluir que la reconstrucción de la temperatura no ha sido posible con los indicadores disponibles.
  3. Con los coeficientes obtenidos en el primer paso se reconstruye la temperatura en el tramo i-ésimo.

De forma gráfica:

Nótese, por tanto, que el proceso que estamos contando garantiza que aquellas series de datos que tienen una forma parecida a la temperatura medida con termómetros en el periodo de calibración van a dominar la reconstrucción de temperatura en los 11 tramos: el algoritmo está diseñado para hacer cherry-picking buscando esos indicadores y darles más peso que al resto de indicadores. Si, como es el caso, se escoge un periodo de calibración que muestra una subida de la temperatura, la elección de ese periodo de calibración en concreto está condicionando qué series de datos van a tener más peso en el procesamiento.

The calibration correlation was, as the name suggests, a measure of how well the series matched up against the temperature records in the calibration period. Those that had high correlations would be heavily weighted and their shapes would therefore dominate the final reconstruction. Andrew Montford

La correlación en la calibración fue, como su nombre indica, una medida de cómo de bien coinciden los indicadores con los registros de temperatura en el período de calibración. Aquellos indicadores con altas correlaciones tendrían un gran peso y, por lo tanto, sus formas dominarían la reconstrucción final.

Por ejemplo, si los datos de temperatura representados en rojo son los correspondientes al periodo de calibración, los indicadores que tengan esa forma en ese periodo van a tener más peso que los que no tengan esa forma en la reconstrucción final de todos aquellos tramos de los 11 en los que esos indicadores estén disponibles:

Quizá el procesado matemático que estamos describiendo nos parezca razonable a primera vista. Pero como vamos a explicar con todo detalle en posteriores entradas, no es así: es una máquina de generar palos de hockey, sin que importe mucho los indicadores concretos empleados. Muy importante: el algoritmo está diseñado para que la temperatura reconstruida sea como la gráfica anterior en el periodo 1902-1980. La subida final de la reconstrucción en la gráfica del palo de hockey no viene de los datos: viene del algoritmo. Insistiré más veces en resaltar esta idea, porque es clave para entender qué está mal en la gráfica del palo de hockey.

Si nos fijamos en lo que se nos presenta como reconstrucción de la temperatura en el último milenio en MBH99, tiene exactamente la forma de los datos de termómetro vista en la gráfica anterior, con un máximo relativo en 1940 (aprox.), tiene un mínimo relativo en 1965 (aprox.) y a partir de ahí vuelve a subir, que es exactamente lo mismo que hacen los datos de termómetro en ese periodo. El algoritmo se ha encargado de que la reconstrucción tenga esa forma en el siglo XX.

Por otro lado, como detallaremos en un artículo posterior, la curva negra que se nos presenta en esta gráfica como supuesta versión suavizada de los datos en azul ha sido retocada en su parte final. Ese suavizado es falso: el suavizado real no tiene esa forma.

Otras entregas:

 

3 comentarios sobre “El palo de hockey (III): cómo se fabrica un palo de hockey

  1. En la siguiente gráfica podemos ver el efecto de elegir un periodo de calibración concreto: en la gráfica de arriba el periodo de calibración es de 1880-1998 y el ajuste es extrapolado a 1850-1880. En la segunda versión el periodo de calibración es 1850-1968 y el ajuste es extrapolado a 1968-1998. Nótese cómo este modelo es incapaz de generar la subida final en el tramo extrapolado.

    Si el periodo de calibración no incluyera la subida de la temperatura del siglo XX es posible que la gráfica del palo de hockey no tuviera esa subida: la subida la crea el algoritmo y la elección del periodo de calibración. La subida en la reconstrucción no viene de los datos.

    Me gusta

Deja un comentario