El palo de hockey (X): “el truco para ocultar la bajada” (MBH98)

Aclaración

A la hora de representar datos que tienen mucha variación se suele acompañar los datos originales de una versión suavizada de los mismos. El suavizado se realiza gracias a un operador matemático denominado “filtro pasobajo”, si bien no hay una única versión de filtro suavizador y el resultado es diferente según la opción elegida. Para lo que nos interesa ahora mismo debemos tener en cuenta que si tenemos unos datos que cubren el periodo 1400-2000 DC, el resultado del suavizado para un año concreto, por ejemplo para el año 1700, se obtiene a partir de datos anteriores y posteriores a ese año, por ejemplo se usan los datos del periodo 1675-1725 para generar el valor suavizado en el año 1700. En este ejemplo diríamos que el filtro tiene una longitud de 51 años. Obviamente esto plantea un problema en los 25 años iniciales y 25 años finales de la serie de datos, pues para esos años no hay 25 años anteriores, en el primer caso, ni 25 años posteriores, en el segundo caso, que permitan realizar el suavizado con un filtro de longitud 51. Una solución obvia es no obtener el resultado de suavizar para los primeros y los últimos valores. Otra solución puede ser crear nuevos datos y añadirlos al principio y al final (esto se llama padding en inglés) para así poder completar el proceso para todos los datos originales. Pero, como es evidente, el resultado del suavizado en los primeros y últimos años no será del todo real, pues dependerá de los valores de relleno empleados. Un valor de relleno que suele emplearse es el valor medio de los primeros/últimos datos.

¿Qué es “el truco para esconder la bajada”?

Recordemos la gráfica del palo de hockey de MBH98. Como ya sabemos, entre otras cosas los autores de la gráfica juntaron en ella dos series de datos procedentes de fuentes independientes, algo que dejan claro en la leyenda, pero visualmente hacen que parezca una única serie de datos.

Como vemos en la gráfica anterior, se da una versión suavizada (trazo negro discontinuo) de la reconstrucción que acaba con una pequeña subida. Para verlo mejor, pinto de rojo la curva negra y hago su trazo continuo. Es la curva original del artículo: no he cambiado nada más que el color de la curva.

En esta página de ClimateAudit podemos encontrar el código que voy a usar para generar las siguientes gráficas. Como se ve en la siguiente figura, los datos generados por ese código, los círculos huecos de color azul, que son los empleados en el análisis que hago a continuación, encajan perfectamente en la gráfica original:

Y ahora hacemos lo siguiente:

  1. Añadimos relleno en la parte inicial/final de valor constante: el valor medio de los primeros/últimos 20 datos.
  2. Filtramos con un filtro de longitud 49 (el propuesto en el código de Matlab obtenido de ClimateAudit, cambiando 50 por 49).
  3. Eliminamos los primeros y últimos datos del filtrado.

En la imagen se pueden ver los datos de relleno resaltados con elipses rojas:

Como vemos en la imagen bajo estas líneas, el suavizado conseguido es bastante fiel al original, salvo en la parte final: nuestra curva suavizada (en azul) acaba hacia abajo mientras que el suavizado original (en negro) acaba hacia arriba.

 

Hagamos una ampliación de la parte interesante:

¿Por qué el suavizado original (en negro) acaba hacia arriba? Pues porque los autores de la gráfica no quisieron mostrar el resultado real, en el que la curva acababa con un descenso. Y “arreglaron” la inconveniente realidad con lo que fue llamado “el truco de Mike [Michael Mann] en [la revista] Nature para esconder la bajada” (Mike’s Nature trick […] to hide the decline). El truco es que en lugar de usar como datos de relleno el valor medio de los últimos datos a suavizar emplearon el valor medio ¡¡¡de los datos de termómetro para los siguientes 15 años!!!, tal y como se describe en este correo electrónico destapado en el ClimateGate (ver):

I’ve just completed Mike’s Nature trick of adding in the real temps to each series for the last 20 years (ie from 1981 onwards) and from 1961 for Keith’s to hide the decline

Vamos a replicar el truco. En rojo he resaltado los datos de relleno que voy a usar ahora, que son el valor medio de los datos de termómetro en el periodo 1981-1995, es decir, tal y como se describe en el e-mail anterior voy a emplear como relleno el valor medio de unos datos diferentes de los que estoy suavizando:

 

Y, efectivamente, con ese truco el suavizado acaba hacia arriba:

Ampliación de la zona de interés:

Como acabamos de ver, la subida final de la curva original es falsa: los autores del palo de hockey contaminaron la curva suavizada de la reconstrucción con valores sacados de los datos de termómetro, creando de esa forma la falsa impresión de que existía gran armonía entre ambos.

En el siguiente artículo veremos el truco en el MBH99.

Otras entregas:

El palo de hockey (IX): un palo hecho con madera imaginaria (resumen de lo visto hasta ahora)

Statistics is thus substituted for physics, is used to assign causality, and is made to pose material time series as temperature. In a classic of scientific non-sequiturs, the entire field of consensus proxy paleo-thermometry has decided that correlation equals causation, and also that correlation in the present proves causation in the past. This is physics by fiat. Patrick Frank

La estadística sustituye por tanto a la física, es usada para asignar causalidad y se hace para interpretar series temporales como temperatura. En un clásico de los non sequitur científicos, todo el campo del consenso en paleo-termometría a partir de indicadores ha decidido que la correlación es igual a la causalidad, y también que la correlación en el presente prueba la causalidad en el pasado. Esto es física por decreto.

Se deduce causalidad en el pasado si el árbol tiene una buena correlación en el presente

La gráfica del palo de hockey se basa en la premisa de que un gran parecido en el periodo 1902-1980 con las medidas de termómetro (es decir, que tenga una alta correlación con la señal de termómetro en el periodo de calibración) es signo de que ese indicador se ha comportado como un termómetro (causa-efecto) desde su nacimiento, es decir, que ha existido causalidad temperatura-grosor de anillos. De la misma manera, un indicador que no se parezca a la temperatura medida con termómetro en el periodo de calibración se considera que no se comporta como un termómetro.

Es decir, en el mejor de los casos, la gráfica está basada en la deducción de causalidad a partir de una correlación: a partir de una correlación en la actualidad se deduce causalidad en el indicador en siglos pasados.

¿Qué hace pensar a los autores de la gráfica que en los indicadores recogidos hay información de temperatura y no simplemente ruido? ¿Siguiendo exactamente el mismo procedimiento y con los mismos datos se puede reconstruir pluviosidad, concentración de CO2 en la atmósfera, luz recibida por el árbol o cualquier otra variable que se nos ocurra? Sólo necesitamos tener datos fiables en la actualidad y podemos hacer esas reconstrucciones. Y si nos sale un palo de hockey una posibilidad será que hemos reconstruido esa señal en el pasado. Pero otra posibilidad es que estemos jugando con ruido, y dependiendo del ruido concreto que hayamos usado salga una cosa u otra.

La subida final de la gráfica no está en los datos: es creada por el procesamiento matemático. Y la forma del mango la marcan los indicadores exitosos en la reconstrucción del siglo XX.

Esto es muy importante: los indicadores empleados en la creación de la gráfica no decían que la temperatura había subido en el último siglo. Eso es fácil de ver, sin más que promediarlos. Es el procesamiento, el algoritmo MBH, el que fuerza la subida final en la reconstrucción. El programa empleado en MHB98/99 busca la mejor forma de combinar linealmente los 112 indicadores empleados para regenerar la forma de la temperatura medida con termómetro en el siglo XX. Y eso se puede conseguir casi siempre si se tiene un juego suficientemente amplio de señales. La subida no es una información que se haya sacado de los indicadores: es una forma que fuerza el algoritmo MBH en el resultado final a poco que los datos lo permitan. La subida en el siglo XX del palo de hockey no es real.

Insisto un poco: si tengo 110 indicadores que son puro ruido, 1 que tiene forma de subida en el siglo XX y uno que tiene forma de bajada en el siglo XX (nótese que el que baja sería reconvertido a ascendente, pues el signo de la correlación con la medida de termómetro es ignorado en MBH), al hacer el promediado me saldría que la señal que tengo es esencialmente ruido sin un patrón marcado y sin nada especial en el siglo XX. Pero el procesamiento de MBH98/99 no hace un promedio de los indicadores, sino que busca cómo combinar los 112 indicadores para generar una subida en el siglo XX que se parezca al máximo con la medida de los termómetros. El procesamiento matemático genera una subida en el siglo XX pero no lo hace porque así se deduce los indicadores: esa subida existe en la gráfica porque el propio algoritmo fuerza que la gráfica tenga esa forma.

La prueba de que esa subida no es real es que sabemos (porque Stephen McIntyre y Ross McKitrick así lo demostraron), que el código del MBH98/99 genera una gráfica con subida en el siglo XX incluso cuando se usa ruido en lugar de los indicadores originales empleados en el artículo. Que el resto de la gráfica sea básicamente horizontal es la consecuencia de que indicadores concretos que son exitosos en reconstruir la señal del periodo de calibración son planos en el resto de siglos. Destacan en este sentido los cedros de Gaspé y la NOAMER PC1, si bien este último no debería tener forma de palo de hockey pero la tenía gracias al empleo de un pseudo-PCA en lugar de un PCA convencional.

Muchas señales de ruido + alguna señal con forma de palo de hockey => Palo de hockey garantizado por el algoritmo. El algoritmo MBH es una máquina de generar palos de hockey.

we conclude unequivocally that the evidence for a ”long-handled” hockey stick (where the shaft of the hockey stick extends to the year 1000 AD) is lacking in the data. McShane y Wyner

concluimos de forma inequívoca que la evidencia para un palo de hockey de largo mango (en el que el mango se extiende hasta el año 1000 DC) no está presente en los datos

La gráfica ni siquiera pasó el control de calidad

La gráfica no pasó el proceso de verificación y los datos de la verificación no se publicaron en el artículo. La emulación de la gráfica del palo de hockey por parte de otros autores demostró que el R² de la verificación era bajísimo, por lo que la reconstrucción carecía de la mínima significancia estadística. El palo de hockey no tiene validez científica pero este hecho se ocultó.

Pero no hemos terminado: en las siguientes entregas veremos “el truco para ocultar la bajada”. Los trucos para ocultar la bajada, más bien, porque son varios trucos.

Otras entregas:

The Hockey Stick (IX): a stick made of imaginary wood (a summary of previous posts)

Statistics is thus substituted for physics, is used to assign causality, and is made to pose material time series as temperature. In a classic of scientific non-sequiturs, the entire field of consensus proxy paleo-thermometry has decided that correlation equals causation, and also that correlation in the present proves causation in the past. This is physics by fiat. Patrick Frank

Causality in the past is inferred from correlation in the present

The hockey stick graph is based on the premise that a great resemblance to thermometer measurements in the period 1902-1980  (that is, having a high correlation with the thermometer signal in the calibration period) means that this proxy has behaved like a thermometer (cause-effect) since its birth, that is, that there has been causality in the temperature – ring widths relationship. In the same way, a proxy that does not resemble the thermometer values in the calibration period is considered to not behave like a thermometer.

That is, at best, this graph is based on the inference of causality from a correlation: causality in past centuries is deduced from correlation.

Why do the authors of the graph believe that in the proxies they collected there is temperature information and they are not just noise? Following exactly the same procedure and from the same data, can they do a reconstrucion of pluviosity, CO2 concentration in the atmosphere, light received by the tree or any other variable that comes to their mind? They just need to have reliable data today and they can do those reconstructions. And if they get a hockey stick, one possibility is that they have successfullyreconstructed that signal in the past. But another possibility would be that they are playing with noise, and depending on the specific noise they use, they get a different outcome.

The final rise in the graph doesn’t come from the data: it is created by the mathematical processing. And the shape of the handle is determined by the shape of those proxies that are important in the reconstruction of the twentieth century.

This is very important: the proxies used in the creation of the graph didn’t say that the temperature had risen in the last century. This is easy to checked: average them. It is the processing, i.e. the MBH algorithm, who forces the final rise in the reconstruction. The computer program used in MHB98/99 seeks the best way to linearly combine the 112 proxies to regenerate the shape of the thermometer temperatures in the 20th century. And that shape can be achieved almost always if you have an ample set of signals. The uptick is not information that has been extracted from the proxies: it is a shape that is imprinted by the MBH algorithm in the final result (whenever the data allows it). The uptick of the MBH hockey stick in the 20th century is not real.

I find these ideas really important. Therefore, I insist a little: let’s say I have 110 proxies that are pure random (i.e. noise), 1 that has a rise in the twentieth century and one that has a decline in the twentieth century (note that the one that goes down will be converted to a rise since the sign of the correlation with the thermometer measurement is ignored in MBH). If I average the proxies I will conclude that the signals I have are essentially noise without a visible pattern and with no special trend in the twentieth century. But the processing in MBH98/99 doesn’t average proxies: it seeks the best way to combine the 112 proxies to generate a rise in the twentieth century that resembles as closely as possible the instrumental measures. It is the mathematical processing what generates a rise in the twentieth century but it does not do so because it is deduced from the proxies: the rise exists in the graph because the algorithm itself forces the graph to have that shape.

The proof that this rise is not real is that we know (as was demonstrated by Stephen McIntyre and Ross McKitrick), that the MBH98/99 code generates a graph with a rise in the 20th century even when red noise (low-pass filtered) is used instead of the original proxies. And the rest of the graph is basically horizontal because those specific proxies that are most successful in helping to reconstruct the calibration period shape happen to be flat in the rest of the centuries. The Gaspé cedars and the NOAMER PC1 stand out in this regard, although the latter shouldn’t have a hockey stick shape but it had it thanks to the use of a pseudo-PCA instead of a conventional PCA.

Many noise signals + some signals shaped like a hockey stick => The hockey stick shape is guaranteed by the algorithm. The MBH algorithm is a hockey stick generating machine.

we conclude unequivocally that the evidence for a ”long-handled” hockey stick (where the shaft of the hockey stick extends to the year 1000 AD) is lacking in the data. McShane and Wyner

The graph didn’t even pass the quality control

The graph did not pass the verification step and the full verification data wasn’t published in the article. The emulation of the hockey stick graph by other authors showed that the R² of the verification was very low, i.e. the reconstruction lacked statistical significance. The hockey stick has no scientific validity but this fact was hidden.

But we are not done: in the next posts we will learn about “the trick to hide the decline”. Or perhaps we should say “the tricks to hide the decline”, because it’s not just one trick.

Other posts:

El palo de hockey (VIII): más mala ciencia

En esta entrega añado algunos detalles que o bien no he mencionado o que creo que merecen más atención de la que les he dado.

Dos de esos detalles los encontramos enumerados en el propio MBH98:

Implicit in our approach are at least three fundamental assumptions. (1) The indicators in our multiproxy trainee network are
linearly related to one or more of the instrumental training patterns. […] Regions not directly represented in the trainee network may nonetheless be indirectly represented through teleconnections with regions that are.

Implícito en nuestro enfoque hay al menos tres supuestos fundamentales. (1) Los indicadores en nuestra red de aprendices multiproxy están relacionados linealmente con uno o más de los patrones de entrenamiento instrumental. […] No obstante, las regiones que no están directamente representadas en la red de entrenamiento pueden representarse indirectamente a través de teleconexiones con regiones que sí lo están.

Es decir, los autores del MBH98 reconocen explícitamente que su trabajo se basa en la premisa de que existe una relación lineal entre temperatura y uno o más de los indicadores empleados en el palo de hockey. Esto es importante: la validez de los resultados obtenidos depende de que las premisas que se han dado por correctas sean realmente correctas, por lo que como mínimo (y aparte de todos los problemas que he explicado en las entregas anteriores) la gráfica del palo de hockey debería ir siempre acompañada de la coletilla “si las premisas de las que se partió son correctas”.

La premisa de la linealidad

Imaginemos (fuente) que el ancho de los anillos de los árboles sí depende de la temperatura, pero no lo hace de forma lineal sino que existe una temperatura óptima de crecimiento, por encima o por debajo de la cual los anillos son menos anchos, tal y como se muestra en la gráfica.

Imaginemos ahora que la temperatura en el año 1100 es la correspondiente al punto B de la gráfica, mientras que la temperatura actual es la correspondiente al punto A. Si se presupone linealidad, al comparar A y B, el año en que los anillos sean más estrechos (B) se interpretará como que ese año la temperatura fue más baja, cuando en realidad la temperatura pudo ser mayor que en el caso A. La interpretación del ancho de un anillo tiene que derivar de la relación real entre temperatura y ancho de los anillos. Presuponer linealidad fuerza una interpretación concreta, pero esa interpretación no tiene por qué ser correcta. Y las implicaciones de esto son enormes: si la gráfica del palo de hockey encuentra valores de los indicadores más bajos hace 1000 años que en la actualidad, ¿por qué interpretar que eso significa que la temperatura fue menor hace 1000 años?

El signo y la causalidad

En realidad, la relación entre temperatura y ancho de anillos, de existir, puede ser lineal pero con pendiente negativa, es decir que los anillos sean cada vez más estrechos cuanto mayor sea la temperatura. Pero sabemos que el palo de hockey tiene la forma que tiene gracias a los pinos longevos parcialmente descortezados, que han tenido un crecimiento anormal en el siglo XX, cuando la temperatura global ha subido algo menos de un grado. En ese caso la interpretación en MBH es que ese crecimiento significa mayor temperatura (fuente) ¿Qué significa que los anillos crezcan en tamaño? ¿Mayor temperatura? ¿Menor temperatura? La respuesta es que en MBH98/99 la interpretación de los anillos de un árbol es la que convenga con tal de que la reconstrucción tenga la misma forma que las medidas de termómetro en el periodo de calibración. Es decir, en MBH98/99 el signo de las correlaciones es ignorado y eso significa que una serie de datos puede ser interpretada tal cual o invirtiendo su signo en función de cómo su forma encaje mejor en la reconstrucción final.

This means that if a proxy has a strong inverted correlation to the (two-pick?) local temperature, it gets picked – no matter what the physical interpretation is! Since RegEM doesn’t care about the sign, it is now really so that the sign does not matter to them anymore. Anything goes!

I’m speechless. Stephen McIntyre

Esto significa que si un proxy tiene una fuerte correlación invertida con la temperatura local (¿dos opciones?), se selecciona, ¡sin importar cuál sea la interpretación física! Como a RegEM no le importa el signo, ahora resulta que el signo no les importa. ¡Todo vale!

Me quedo sin palabras.

De hecho, como vimos, el NOAMER PC1 es un palo de hockey, pero ¡que baja! y sin embargo es reinterpretado por el algoritmo MBH como útil para reconstruir la subida en el siglo XX, simplemente escalándolo por un factor negativo. Otro caso clamoroso es el de Tiljander, unos sedimentos que fueron empleados en una reconstrucción posterior (M08, Mann 2008) invertidos respecto de la interpretación que hacía la fuente original de los mismos (fuente). Aparte de eso, la parte más reciente de esos sedimentos era inválida, pero Mann la usó igualmente.

The claim that ‘‘upside down’ data were used is bizarre. Multivariate regression methods are insensitive to the sign of predictors. Michael Mann

La afirmación de que se usaron los datos boca abajo es extraña. Los métodos de regresión multivariable son insensibles al signo de los predictores.

¡¡Exacto!! Por eso es totalmente inapropiado el empleo de ese algoritmo. Usar la versión que mejor encaje en la reconstrucción, la normal o la invertida, es absurdo, pues los hipotéticos mecanismos físicos o biológicos que relacionan la temperatura con esos indicadores no son insensibles al signo de los datos. ¿Es compatible la presunción de que existe una relación causa-efecto entre los indicadores y la temperatura, con el hecho de que al algoritmo el signo de la serie de datos le resulte irrelevante? Creo que esto es una prueba clara de que el algoritmo MBH es un procesamiento de datos sin ningún tipo de sentido, y sin pretensión de tenerlo. Se deduce causalidad de una correlación sin más justificación que que se quiere deducir. Y porque la gráfica era útil para hacer avanzar el alarmismo climático.

Un par de apuntes más relativos a la importancia del signo: ¿puede en el algoritmo MBH un mismo indicador ser usado en algunos de los 11 tramos con coeficiente positivo y en el resto con coeficiente negativo? (fuente) Y teniendo en cuenta que algunos de los 112 indicadores MBH eran en realidad medidas de termómetro, ¿qué se puede decir de un algoritmo que invierte el signo de esas series de datos en la reconstrucción?

Las teleconexiones

Y abundando en la misma idea, otro concepto empleado en las reconstrucciones de ruido en el pasado es el de las teleconexiones. ¿Qué es la teleconexión? Es la idea de que un indicador en un lugar del planeta, pongamos que es un árbol en Valencia, es un sensor de la temperatura media anual en España, por ejemplo medida en Vigo. ¿Que no tiene sentido? Pues da igual: si se encuentra una correlación convincente entre ambas variables se asume que existe una relación causa-efecto. Es indiferente que no se tengan datos de temperatura medidos exactamente en el lugar donde está el indicador y que asumir la “teleconexión” sea la única forma de publicar artículos y hacer progresar la propia carrera como científico: esto no es ni serio ni ciencia.

En algunos artículos se ha considerado que un indicador era válido si su correlación con la temperatura superaba un cierto umbral al usar alguno de los dos datos de termómetro más próximos (fuente,fuente), es decir, el árbol puede no ser sensible a una temperatura medida a 100 km de distancia, pero mágicamente responder a la temperatura medida a 300 km de distancia. La misma idea se ha aplicado también con división en células: el indicador es fiable si tiene buena correlación con la célula de cómputo o con una célula adyacente a menos de 500 km (fuente). Porque si un árbol de Valencia responde a la temperatura en Burgos mejor que a la temperatura de Castellón eso demuestra que el indicador es fiable. Es lógico…

Considering that Mann et al believe in “teleconnections” of local sites with hemispheric climate, or that it is valid to view a site as a global indicator rather than reflecting strictly local temperature history, any correlation is a good correlation and there is no such thing as “upside down” thus SM is speaking nonsense. Craig Loehle

Teniendo en cuenta que Mann et al. creen en las “teleconexiones” de sitios locales con clima hemisférico, o que es válido ver un sitio como un indicador global en lugar de reflejar estrictamente el historial de temperatura local, cualquier correlación es una buena correlación y no existe tal cosa como “boca abajo”, por lo que Stephen McIntyre dice tonterías.

Cherry-picking

¿Con qué criterio se escogieron los 112 indicadores usados en en MBH98? ¿Por qué esos indicadores y no otros? Sin unos criterios públicos y establecidos a priori no existe ninguna garantía de que no se hayan ido probando indicadores hasta conseguir un resultado preestablecido (fuente).

Otras entregas:

El palo de hockey (VII): la divergencia de los pinos longevos

Como ya hemos visto, los indicadores procedentes de pinos longevos (bristlecones) juegan un papel importante en la gráfica del palo de hockey:

For periods prior to the 16th century, the Mann et al. (1999) reconstruction that uses this particular principal component analysis technique is strongly dependent on data from the Great Basin region in the western United States. “Surface Temperature Reconstructions for the Last 2,000 Years“, del National Research Council.

Para períodos anteriores al siglo XVI, la reconstrucción de Mann et al. (1999) que utiliza esta técnica particular de análisis de componentes principales depende en gran medida de los datos de la región de la Gran Cuenca del oeste [pinos longevos] de los Estados Unidos.

In the MBH98 de-centered PC calculation, a small group of 20 primarily bristlecone pine sites, all but one of which were collected by Donald Graybill and which exhibit an unexplained 20th century growth spurt (see Section 5 below), dominate the PC1. Only 14 such chronologies account for over 93% of the variance in the PC1 effectively omitting the influence of the other 56 proxies in the network. McIntyre y McKitrick 2005

En el cálculo de PC descentrado MBH98 [pseudo-PCA], un pequeño grupo de 20 sitios principalmente de pinos longevos, todos menos uno de los cuales fueron recolectados por Donald Graybill y que exhiben un brote de crecimiento inexplicable en el siglo XX (ver la Sección 5 a continuación), dominan la PC1. Sólo 14 de estas cronologías representan más del 93% de la varianza en la PC1, omitiendo efectivamente la influencia de los otros 56 proxies en la red.

Stephen McIntyre comprobó en qué medida (grados centígrados) contribuía cada grupo de árboles de los empleados en MBH98 en la reconstrucción final y lo representó en la siguiente gráfica, en la que en rojo podemos ver la contribución de los pinos longevos (fuente):

Nótese por otro lado que la contribución del resto de grupos de árboles es ruido sin ningún tipo de tendencia detectable a simple vista. Podemos comparar la curva roja de la gráfica anterior con el palo de hockey (figura bajo estas líneas) y salta a la vista la similitud: -0.2 grados hasta 1900 y de ahí subida hasta 0.2 grados al final del siglo XX:

La divergencia

Cuando los anillos de un árbol hacen lo contrario que la temperatura los expertos en dendroclimatología dicen que existe un problema de “divergencia”. Por ejemplo, desde 1960-70 en los bosques del norte (elevada latitud) es común encontrar árboles que desarrollan anillos cada vez más pequeños (fuente) mientras las temperaturas suben.

Los pinos longevos empleados en el MBH98/99 habían tenido un comportamiento extraño durante todo el siglo XX: sus anillos crecían más que otros pinos de sus zonas. En concreto, los pinos longevos empleados en el palo de hockey fueron seleccionados por tener una característica concreta: tener descortezado parcial (strip-bark, en inglés). Se buscaron a propósito datos de esos árboles porque se había detectado que en el siglo XX crecían más rápido que los que tenían toda la corteza (whole-bark, en inglés) (fuente). Nótese la diferencia, en negro un strip-bark y en rojo un whole-bark, supuestamente sometidos a temperaturas similares (fuente):

La razón de ese cambio de comportamiento no estaba clara y se hablaba de fertilización por CO2 o de que al no poder crecer por la parte muerta, la parte descortezada, crecían más por las orientaciones que todavía estaban vivas (fuente,fuente,fuente), que era de donde se sacaron las muestras (y a partir de ellas los indicadores del MBH). Dependiendo del lugar concreto del árbol en que se toma la muestra la diferencia puede ser notable (fuente). En la búsqueda de una explicación a este fenómeno incluso se postuló que la diferencia entre los whole-bark y los strip-bark era debida a un mal procesado de los datos (fuente), pero Stephen McIntyre no lo cree así (fuente).

In fact, the equation was even more complex than this. Bristlecones often exist in a strange ‘stripbark’ form, where the bark on one side of the tree dies back. It turned out that Graybill had actively sought out stripbark trees when he collected the samples that ended up in the NOAMER PC1 , believing that these would be more susceptible to carbon dioxide fertilisation. Although some authors had claimed that bristlecones could still be used for temperature reconstructions because only the stripbark form was affected in this way, it was simple enough to demonstrate that there were only stripbark trees in Graybill’s samples. The NOAMER PC1 and Mann’s results were therefore inherently unreliable. Andrew Montford en “The hockey stick illusion”.

De hecho, la ecuación fue aún más compleja que esto. Los pinos longevos [bristlecones] a menudo existen en una extraña forma descortezada, donde la corteza a un lado del árbol muere. Resultó que Graybill había buscado activamente árboles con descortezado parcial cuando recolectó las muestras que terminaron en NOAMER PC1, creyendo que serían más susceptibles a la fertilización con dióxido de carbono. Aunque algunos autores han afirmado que los pinos longevos [bristlecones] todavía podrían usarse para reconstrucciones de temperatura porque solo la variedad parcialmente descortezada [strip-bark] se ve afectada de esta manera, fue muy sencillo demostrar que solo había árboles parcialmente descortezados [strip-bark] en las muestras de Graybill. Los resultados de NOAMER PC1 y Mann eran, por lo tanto, poco fiables.

Por otro lado, la Tesis Doctoral de Linah Abaneh (fuente,fuente,fuente) mostraba versiones actualizadas de algunos de los pinos longevos empleados en el MBH98/99 y la forma de palo de hockey había desaparecido. Como curiosidad, esta mujer se negó a compartir sus datos con McIntyre por consejo de su abogado (fuente).

Para complicarlo todo un poco más, datos más recientes que los de MBH98/99 muestran que en algunos de esos pinos a partir de 1980 el grosor de los anillos ha descendido, al tiempo que la temperatura subía (fuente,fuente,fuente): “divergencia” a tutiplén que deja bien claro que la hipótesis de que un árbol es un termómetro no es otra cosa que un acto de fe. Y si hay constancia de que actualmente ante una subida de temperatura los anillos igual crecen que decrecen, ¿por qué creer que en el año 1000 o en el 1500 esos árboles se comportaban como un termómetro?

The observed discrepancy between some tree ring variables that are thought to be sensitive to temperature and the temperature changes observed in the late 20th century (Jacoby and D’Arrigo 1995, Briffa et al. 1998) reduces confidence that the correlation between these proxies and temperature has been consistent over time. NAS Panel Report

La discrepancia observada entre algunas variables de anillo de árbol que se cree que son sensibles a la temperatura y los cambios de temperatura observados a fines del siglo XX (Jacoby y D’Arrigo 1995, Briffa et al. 1998) reducen la confianza en que la correlación entre estos indicadores y la temperatura ha sido consistente en el tiempo.

If the flawed bristlecone pine series are removed, the hockey stick disappears regardless of how the PCs are calculated and regardless of how many are included. The hockey stick shape is not global, it is a local phenomenon associated with eccentric proxies. Mann discovered this long ago and never reported it. Ross McKitrick

Si se eliminan las defectuosas series de pinos longevos, el palo de hockey desaparece independientemente de cómo se calculen las PCs y de cuántos se incluyan. La forma del palo de hockey no es global, es un fenómeno local asociado con indicadores que se comportan de forma extraña. Mann descubrió esto hace mucho tiempo y nunca lo reportó.

¿Defectuosos? ¿Que se comportan de forma extraña? ¿Por qué dicen McIntyre y McKitrick que Mann lo sabía (y evidentemente no dijo que su “maravillosa” gráfica dependía del uso de unos indicadores concretos)? Pues porque en un directorio de los datos empleados por Mann et al. para construir el palo de hockey estaban los resultados de omitir esos árboles en concreto en los cálculos. Era el directorio BACKTO_1400-CENSORED (fuente). El resultado de hacer esas pruebas no se publicó ni se comentó en el artículo, pero obviamente los autores del MHB98/99 trataron esos árboles de forma especial, comprobando cuál era el efecto de no considerarlos: desaparecía la forma de palo de hockey de los componentes principales NOAMER (fuente). Ocultaron el resultado, pero ¿por qué razón habían hecho esa comprobación? Parece lógico pensar que sabían que los anillos de esos árboles habían crecido de una forma anormal en el siglo XX y sin una clara causa (fuente,fuente).

If de-centered PC calculation is carried out (as in MBH98), then MM-type results still occur regardless of the presence or absence of the PC4 if the bristlecone pine sites are excluded, while MBH-type results occur if bristlecone pine sites (and PC4) are included. Mann’s FTP site [Mann, 2002–2004] actually contains a sensitivity study on the effect of excluding 20 bristlecone pine sites5 in which this adverse finding was discovered, but the results were not reported or stated publicly and could be discerned within the FTP site only with persistent detective work. McIntyre y MacKitrick

Si se realiza el cálculo de PC descentrado (como en MBH98), los resultados de tipo MM [McIntyre y McKitrick] aún ocurren independientemente de la presencia o ausencia de la PC4 si se excluyen los sitios de pino longevo, mientras que los resultados de tipo MBH sólo ocurren si los sitios de pino longevo (y el PC4) están incluidos. El sitio FTP de Mann [Mann, 2002–2004] en realidad contiene un estudio de sensibilidad sobre el efecto de excluir 20 sitios de pino longevo en el que se descubrió este hallazgo adverso, pero los resultados no se reportaron ni se comentaron públicamente y solo se pudieron discernir dentro del sitio FTP con persistente trabajo detectivesco.

Como nota final, los anillos de los pinos longevos tienen mejor correlación con la pluviosidad y el CO2 que con la temperatura (fuente).

Otras entregas:

El palo de hockey (VI): la implacable máquina de fabricar palos de hockey (2/2)

Como resumen de lo que hemos visto hasta ahora, el procesamiento matemático de datos en MBH98/99 (los artículos en los que se publicó el palo de hockey) es una máquina implacable de fabricar palos de hockey. Los palos de hockey se generan en dos etapas:

  1. Entre los indicadores tiene que haber alguno con forma de palo de hockey.
  2. La etapa de calibración asignará gran peso a ese/os estimador/es para así conseguir que la reconstrucción en el siglo XX sea una señal que sube.

Y también he resaltado que la subida que vemos en el siglo XX de la señal reconstruida no es algo que se deduzca de los indicadores que están siendo procesados: es algo que impone el algoritmo que se está empleando, que buscará los coeficientes adecuados para conseguir esa forma ascendente. La subida final no depende, por tanto, demasiado de los indicadores, pues el algoritmo MBH buscará la mejor forma de lograr esa subida con los más de 100 indicadores disponibles en el siglo XX. Es casi seguro que lo va a conseguir, incluso a partir de ruido rojo (filtrado pasobajo). En la imagen se muestran 9 gráficas que son el resultado de alimentar el algoritmo MBH con ruido. La décima es el palo de hockey MBH:

Pero si bien la subida en el siglo XX es una imposición del algoritmo, el proceso de construir esa subida influye en todo el periodo reconstruido (casi mil años en MBH99): los indicadores con subida o bajada en el siglo XX imponen la forma de la reconstrucción en los siglos anteriores. En ese sentido, el palo de hockey presentado en MBH98/99 es plano antes del siglo XX gracias a la presencia de ciertos indicadores:

  • La NOAMER PC1 con forma de palo de hockey gracias al uso del pseudo-PCA. A su vez el palo de hockey en esta PC1 sólo existirá si se incluyen entre los indicadores fuentes del pseudo-PCA los pinos longevos y los cedros de Gaspé (cana036). Si en lugar de usar el pseudo-PCA se usa un PCA convencional (y en presencia de los pinos longevos o los cedros de Gaspé) se desplaza la forma de palo de hockey a la PC4. Es decir, aunque no se use el pseudo-PCA la presencia de ciertos árboles generará una reconstrucción con forma de palo de hockey si se incluye la NOAMER PC4 entre los indicadores disponibles para el algoritmo. En tal caso de forma absolutamente indefendible la PC4 acaba teniendo más peso que las componentes de menor numeración.
  • Los cedros de Gaspé como indicador independiente (treeline11.dat).

La forma más obvia por tanto de que el algoritmo empleado en el MBH98/99 no dé como resultado una subida en el siglo XX es no emplear ni los cedros de Gaspé ni los pinos longevos de Graybill. O también podemos quitar los cedros de Gaspé, usar un PCA convencional en NOAMER y no coger más que la NOAMER PC1 y la PC2 (pues la forma del palo de hockey estará en la PC4).

Fijémonos en qué sucede con la reconstrucción antes del siglo XX si no se usan ni los cedros de Gaspé ni los pinos longevos:


Y si simplemente se reinsertan los cedros de Gaspé (en esta prueba se reintroducen en ambos lugares, como indicador independiente y como parte de las NOAMER PC, calculadas con pseudo-PCA), bajan los valores previos al siglo XX:

In McIntyre and McKitrick 2005b, we observed that, if the Graybill bristlecones (and an equally questionable cedar series) are removed from the MBH98 network, even with its questionable multivariate methodology, in an MBH98-type calculation, one obtained high 15th century values, contradicting claims to 20th century uniqueness. McIntyre and McKitrick

En McIntyre y McKitrick 2005b, observamos que, si los pinos longevos Graybill (y una serie de cedro igualmente cuestionable) se eliminan de la red MBH98, incluso con su cuestionable metodología multivariable, en un cálculo de tipo MBH98, se obtienen valores altos en el siglo XV, lo que contradice las afirmaciones de la singularidad del siglo XX.

Si de una forma u otra en toda reconstrucción se fuerza que su forma en el periodo de calibración sea la de la temperatura de termómetro, que la superposición de reconstrucciones de diferentes autores refleje ese patrón no es una prueba de la validez de las reconstrucciones, sino de la consistencia de los algoritmos (ya sea con cherry-picking previo o como en MHB98/99 mediante el procesamiento matemático) en forzar esa forma en las reconstrucciones. En la imagen se muestra una superposición de diferentes reconstrucciones que sólo sirve para hacer evidente dónde está el periodo de calibración cuya reconstrucción se está forzando de una forma u otra:

Para acabar esta entrega, muestro una reconstrucción propuesta por otro autor de la (anomalía de) temperatura del último milenio (fuente,fuente):

La curva azul es la reconstrucción y la curva roja es la temperatura de termómetro. La parte en que ambas zonas se solapan es claramente el período de calibración, pues es obvio que se han obtenido los coeficientes lineales óptimos para que la reconstrucción encaje con la curva roja en esa zona y ese ajuste es el que se ha extendido a todo el periodo considerado. Como he explicado en anteriores entregas, éste es el método empleado en MBH98/99. Pues bien, lo que estamos viendo es el resultado de aplicar el proceso a ruido (valores al azar o señal aleatoria), no a supuestos indicadores de temperatura. Es decir, se ha reconstruido la temperatura del último milenio a partir de señales que no tienen ninguna información de temperatura y nos ha salido un palo de hockey. ¿No nos hace esto sospechar nada sobre la falta de validez del palo de hockey de MBH98/99? Un palo de hockey es lo que crea el algoritmo MBH cuando es alimentado con ruido.

the ’hockey-stick’ pattern is easily produced by selecting those random series that correlate over the period of the calibration temperatures (producing the blade) and revert to randomness elsewhere (producing the handle). David Stockwell

la forma de “palo de hockey” se produce fácilmente seleccionando aquellas series aleatorias que se correlacionan con las temperaturas del período de calibración (produciendo la cuchilla) y siguen siendo aleatorias en cualquier otro tramo (produciendo el mango).

all the salient aspects of past climate usually associated with millennial reconstructions are essentially already encoded into the methodology, so that a ’hockey-stick’ shape is inevitable on any data resembling natural LTP series. David Stockwell

todos los aspectos reseñables del clima pasado generalmente asociados con reconstrucciones milenarias están esencialmente codificados en la metodología, por lo que una forma de “palo de hockey” es inevitable en cualquier dato que se parezca a la serie LTP natural.

Lo que hicieron los autores del palo de hockey es realmente admirable: inventaron una forma de averiguar la temperatura del planeta a partir de un juego suficientemente amplio de señales, sin que en ese proceso importe lo más mínimo si esas señales tienen algo que ver con la temperatura del planeta. Y esta gráfica ha sido presentada a nivel mundial como un dato científico. Esto sí que es acojonante, y no el cambio climático.

Leer más:

Otras entregas:

El palo de hockey (VI): la implacable máquina de fabricar palos de hockey (1/2)

Habíamos acabado la entrega anterior diciendo que en el PCA del MBH98 podías alimentar el proceso con datos de bolsa elegidos al azar y la PC1 resultante era un palo de hockey. Y no lo decía por decir: Stephen McIntyre había comprobado que era así (fuente).

El pseudo-PCA del MBH98/99

En MBH98 se decía que el PCA utilizado era “convencional”, pero de convencional no tenía nada. En lugar de normalizar los datos empleando la media real del indicador (usando todos los datos), se empleaba la media calculada únicamente en el periodo de calibración:

by examining PC series archived there and, by examining source code for PC calculations, we were able to determine that MBH98 had not carried out a “conventional” PC calculation, but had modified the PC algorithm, by, among other things, subtracting the 1902-1980 mean, rather than the 1400-1980 column mean, prior to PC calculations, so that the columns were no longer centered on a zero mean in the 1400–1980 step. By this procedure, series are more decentered, and their variance more inflated, the larger is the difference between the series mean and the mean of the 20th century subset. The effect of this transformation would have been mitigated if they had carried out a singular value decomposition on the covariance matrix, but they carried it out on the de-centered data matrix. We have shown elsewhere that this method re-allocates variance so that the PC algorithm then strongly over-weights hockey stick-shaped proxies and that it is so efficient in mining a hockey stick shape that it nearly always produces a hockey-stick shaped PC1 even from persistent red noise. McIntyre & McKitrick 2005

Al examinar las series de PC archivadas allí y, al examinar el código fuente para los cálculos de PC, pudimos determinar que MBH98 no había llevado a cabo un cálculo de PC “convencional”, sino que había modificado el algoritmo de PC, entre otras cosas, restando la media de 1902-1980, en lugar de la media de la columna de 1400-1980, antes de los cálculos de PC, de modo que las columnas ya no estaban centradas en una media de cero en el paso 1400-1980. Mediante este procedimiento, las series están más descentradas y su varianza está más inflada cuanto mayor es la diferencia entre la media de la serie y la media del subconjunto del siglo XX. El efecto de esta transformación se habría mitigado si hubieran llevado a cabo una descomposición de valores singulares en la matriz de covarianza, pero siguieron adelante con la matriz de datos descentrada. Hemos demostrado en otra parte que este método recoloca la varianza para que el algoritmo de la PC haga sobresalir con fuerza los indicadores con forma de palo de hockey y que es tan eficiente en la extracción de una forma de palo de hockey que casi siempre produce una PC1 con forma de palo de hockey incluso a partir de ruido rojo persistente.

El efecto de esa extraña forma de hacer el PCA (pseudo-PCA, en adelante) era que aquellas series de datos con forma de palo de hockey recibían un gran peso y marcaban el resultado final, especialmente la componente más importante, la PC1. Los indicadores que marcaban la forma de la PC1 eran lógicamente todos aquellos que tuvieran forma de palo de hockey, y en concreto los pinos longevos (bristlecones):

Por ejemplo, dadas las dos series de datos mostradas en la gráfica bajo estas líneas, en el pseudo-PCA la mostrada en la parte superior tiene un peso 390 veces mayor que la de la parte inferior en el cálculo de la PC1 porque tiene una notable desviación de la media en el siglo XX:

Con pseudo-PCA el resultado será prácticamente siempre (99% de las veces) un palo de hockey, incluso cuando se usa ruido en lugar de los indicadores sacados de árboles como entrada del algoritmo. La única condición que deben cumplir los datos es que alguno de ellos tenga forma de palo de hockey, algo que puede suceder por azar o simplemente asegurándose de que alguna de las series de datos tiene esa forma: el pseudo-PCA se encarga de darle a esos datos un papel principal en el resultado. Por ejemplo, en la parte superior de la figura se muestra la PC1 resultante de aplicar el pseudo-PCA a ruido rojo persistente:

The primary criticism of McIntyre & McKitrick, which has gotten a lot of play on the Internet, is that Mann et al transformed each tree ring prior to calculating PCs by subtracting the 1902-1980 mean, rather than using the length of the full time series (e.g., 1400-1980), as is generally done. M&M claim that when they used that procedure with a red noise spectrum, it always resulted in a “hockey stick”. Is this true? If so, it constitutes a devastating criticism of the approach. If not, it should be refuted. David Rind

La principal crítica de McIntyre & McKitrick, que ha dado mucho juego en Internet, es que Mann et al. transformaron cada anillo de árbol antes de calcular las PC restando la media de 1902-1980, en lugar de usar la longitud temporal completa de la serie (por ejemplo, 1400-1980), como se hace generalmente. M&M afirman que cuando usaron ese procedimiento con un espectro de ruido rojo, siempre resultó en un “palo de hockey”. ¿Es esto cierto? Si es así, constituye una crítica devastadora del enfoque. Si no es así, debe ser refutado.

Sí, el dato es tremendo. Aun teniendo en cuenta que la PC1 no es la reconstrucción final, sino uno más de los indicadores usados, sabemos que el algoritmo MBH potenciará aquellos indicadores que se parezcan a las medidas de termómetro en el periodo de calibración. Es la combinación de los dos factores lo que crea el palo de hockey: la presencia de indicadores con forma de palo de hockey, como por ejemplo la NOAMER PC1 creado por el pseudo-PCA, y el algoritmo que potencia los indicadores con esa forma.

Si el PCA es convencional… la PC1 deja de tener forma de palo de hockey

En la gráfica se muestra la PC1 resultante de usar el pseudo-PCA (parte superior) y el resultado de emplear un PCA convencional (parte inferior). Es evidente que el palo de hockey de la NOAMER PC1 no es un correcto resumen de los datos de los que procede: el palo de hockey de este indicador es creado por el no-convencional procesamiento de esos datos.

imagen_5111

Con un PCA convencional la forma de palo de hockey aparece en la PC4, en lugar de en la PC1 (fuente). En en el MBH98/99 únicamente se empleaban la PC1 y la PC2 pero si existe un indicador, la PC4, con forma de palo de hockey el algoritmo le va a dar un gran peso en el proceso de calibración. Esto quiere decir que usar un PCA convencional no resuelve los problemas causados por el algoritmo MBH, que encontrará y potenciará cualquier señal que se parezca a la medida de termómetro en el periodo de calibración. El algoritmo MBH debe ser cuestionado, pero también es cuestionable si se pueden tratar componentes principales aisladas como indicadores, pues el algoritmo asignaría un gran peso a la PC4, una señal para la que no hay absolutamente ninguna razón para suponer una relación lineal con la temperatura, algo que ya es mucho suponer incluso para la PC1, que viene a ser algo así como la señal promedio de los datos fuente del PCA. A Mann dar más peso a la PC4 que a la PC1 no le parece ningún problema, pero para cualquier persona objetiva esto es equivalente a usar una señal completamente inventada simplemente porque es buena para reconstruir el periodo de calibración. Ese procesado es posible pero no tiene sentido. El uso de PCs como indicadores no ha sido justificado debidamente.

It therefore seems crazy that the MBH hockey stick has been given such prominence and that a group of influential climate scientists have doggedly defended a piece of dubious statistics. Ian Joliffe

Por lo tanto, parece una locura que al palo de hockey MBH se le haya dado tanta relevancia y que un grupo de influyentes científicos climáticos hayan defendido obstinadamente una serie de estadísticos dudosos.

No olvidemos lo importante

Para no perdernos, la idea clave es que los indicadores NOAMER PC (componentes principales calculados mediante PCA) están “mal” calculados. Y lo mismo pasa con otros indicadores PC. Es algo objetivo, pues como acabamos de ver el pseudo-PCA genera él solito un resultado predeterminado (forma de palo de hockey). Y lo otro que habíamos visto es que de forma artificial se había incluido un árbol concreto en el tramo 1400-1450. Si se corrigen ambos “errores” la reconstrucción no es diferente en el siglo XX de lo que lo era en el año 1400:

Por supuesto, en MBH98 podían haber iniciado el análisis en 1404 y no habrían tenido que recurrir a inventarse los datos de los primeros 4 años del cedró de Gaspé, pero en ese caso el resultado sería diferente si el análisis empieza en 1400 o si empieza en 1404. Y si por poner 1 árbol en el análisis o no ponerlo el resultado cambia, eso significa que la presencia de los datos de un único árbol es determinante para concluir si la temperatura hace 600 años estaba por debajo o no de la de finales del siglo XX. Creo que eso es lo que se llama robustez de las conclusiones. Nula robustez quiero decir. Y es que la gráfica del palo de hockey es ruido del que no se puede sacar ninguna conclusión.

Para acabar esta entrega, en la imagen muestro otra PC1, la procedente de hacer el PCA en indicadores de origen australiano. En la parte superior se muestra la PC1 si se usa el pseudo-PCA, mientras que en la parte inferior se muestra la PC1 con PCA convencional.

NOTA: se ha argumentado que en el caso de usar un PCA convencional la regla de Preisendorfer sugiere que hay que usar hasta el NOAMER PC5 (fuente). Es evidente que esa regla no es de aplicación cuando las PCs resultantes se usan como indicadores independientes y con pesos que no respetan la varianza que representan esas PCs, por ejemplo asignando a la PC4 más peso que a la PC1 en la reconstrucción de temperatura.

Otras entregas: