La adicción al cherry-picking en la Iglesia de la Calentología

Una información más detallada de lo que cuento en esta entrada se puede encontrar en este artículo de Andrew Montford.

this does not mean that one could not improve a chronology by reducing the number of series used if the purpose of removing samples is to enhance a desired signal. The ability to pick and choose which samples to use is an advantage unique to dendroclimatology. Esper et al. 2003

esto no significa que no se pueda mejorar una cronología mediante la reducción del número de series utilizadas si el propósito de eliminar muestras es mejorar la señal deseada. La capacidad de elegir qué muestras usar es una ventaja exclusiva de la dendroclimatología.

Escoger las series de datos que te permiten generar la señal que quieres, al tiempo que se ignoran las series de datos que te alejan de ese resultado deseado, es una práctica pseudocientífica denominada cherry-picking.

Los Urales Polares

Los datos procedentes de árboles de la región de los Urales Polares habían sido usados en prácticamente todas las reconstrucciones de “temperatura” basadas en árboles publicadas hasta el año 2005 (fuente). Gracias exclusivamente a esa serie de datos algunas de esas reconstrucciones conseguían el objetivo alarmista de eliminar el Periodo Cálido Medieval (ver).

¿Qué pasó en 2005? Ése fue el año en que McIntyre descubrió que esta serie de datos tenía (desde 1999) datos actualizados que no se habían usado en las reconstrucciones (fuente). Y, de hecho, la actualización no se “archivó”, es decir no se compartió con otros investigadores para ser usada en las reconstrucciones. ¿Qué problema tenía la nueva versión de los datos? Que mostraba valores en el siglo XI por encima de los del siglo XX, es decir, tenía un “problema”: sí mostraba el Periodo Cálido Medieval. Unos datos inconvenientes para el alarmismo. ¡Mejor no archivarlos y hacer como que no existen! El alarmismo tiene solución para los datos inconvenientes.

La existencia de esa actualización dejaba dos opciones para los científicos alarmistas: 1) usar los nuevos datos, que ya no tenían una forma de palo de hockey, o 2) dejar de usar los datos procedentes de los Urales Polares y buscar otros datos que les diesen la deseada forma de palo de hockey en sus reconstrucciones. Como era de esperar, los alarmistas dejaron de usar los Urales Polares, con datos muy numerosos, y pasaron a usar datos de una zona cercana denominada Yamal, mucho más reducidos en número pero que sí les daban una forma de palo de hockey útil para su misión (fuente).

the subsequent Briffa et al (2008 Phil Trans B) only includes the very small Yamal data – without the long Polar Urals chronology or the shorter chronologies. Wonder why? Stephen McIntyre

el posterior Briffa et al (2008 Phil Trans B) sólo incluye los muy pequeños datos de Yamal, sin la larga cronología de los Urales Polares o las cronologías más cortas. ¿Te preguntas por qué?

Mientras los Urales Polares decían “lo que tenían que decir” fueron útiles. Cuando dejaron de decir “lo que tenían que decir” dejaron de ser útiles.

Una imagen vale más que mil palabras. Yamal (negro) frente a Urales Polares actualizados (rojo):

O esta otra gráfica:

darrig72

Yamal

Yamal, por su parte, tenía sus propios problemas: la versión publicada en 2002 por los científicos rusos que recopilaron los datos, llamados Hantemirov y Shiyatov, no tenía una tendencia clara en el siglo XX, mientras que la versión empleada por los alarmistas a partir del año 2000 sí tenía una clara subida en el siglo XX (fuente). A la vista de esta diferencia con los datos originales, McIntyre pidió a Briffa los datos empleados en su artículo de 2006, petición que fue rechazada. McIntyre pidió entonces esos datos a la revista Science, petición que tampoco fue atendida, aunque le dijeron que debía pedir esos datos a los autores del artículo fuente de los mismos, que era anterior al de 2006. McIntyre pidió nuevamente los datos a Briffa, esta vez en su calidad de autor del artículo anterior, como Science había sugerido, y su petición fue nuevamente rechazada por éste.

En 2008 un nuevo artículo de Briffa abrió el camino a que los datos fueran examinados por McIntyre: en ese artículo se usaban nuevamente los datos de Yamal, pero el artículo había sido publicado en una revista de la Royal Society, cuya política de compartición de datos con otros investigadores era clarísima. McIntyre solicitó acceso a los datos y más de un año después esos datos finalmente le fueron entregados. La persecución de esos datos había durado 3 años en total.

Lo que encontró McIntyre fue realmente sorprendente: sin razón conocida Briffa sólo había usado la mitad de los datos originales para Yamal, hasta el punto de que en la parte final del siglo XX la reconstrucción de “temperatura” se había creado a partir de apenas una decena de árboles y la subida final en el siglo XX la creaba tan sólo uno de ellos:

Why did Briffa only have half the number of cores covering the Medieval Warm Period that the Russian had reported? And why were there so few cores in Briffa’s twentieth century? By 1988 there were only 12 cores used, an amazingly small number in what should have been the part of the record when it was easiest to obtain data. By 1990 the count was only ten, dropping still further to just five in 1995. Without an explanation of how the selection of this sample of the available data had been performed, the suspicion of ‘cherrypicking’ would linger over the study, particularly since the sharp twentieth century uptick in the series was almost entirely due to a single tree (fuente)

¿Cómo se llama usar sólo algunos de los datos disponibles, de tal forma que consigues el resultado que quieres? Cherry-picking.

Pero el cherry-picking no se limitaba a usar sólo la mitad de los datos de Yamal.

¿Por qué usar sólo Yamal?

¿Por qué no usar también la más numerosa serie de datos de los Polares Urales, de la misma región, en lugar de hacer la reconstrucción a partir de sólo una decena de “cores”?

En la gráfica se compara el número de series de datos disponibles para cada año en toda la región (color salmón) y las series disponibles sólo de Yamal, es decir las usadas por Briffa et al. (en azul):

McIntyre planteó en su blog las preguntas anteriores (ver enlaces en la parte final de esta entrada), con el dato adicional de que al añadir otras series de datos también disponibles en la zona (Khadyta River) la forma de palo de hockey desaparecía (fuente,fuente). Los alarmistas primero contestaron que McIntyre no era un científico profesional y que, por tanto, no sabía de lo que hablaba. Según ellos no se podían usar tan alegremente los datos que uno encontraba en internet.

McIntyre has based his ‘critique’ on a test conducted by randomly adding in one set of data from another location in Yamal that he found on the internet. People have written theses about how to construct tree ring chronologies in order to avoid end-member effects and preserve as much of the climate signal as possible. Curiously no-one has ever suggested simply grabbing one set of data, deleting the trees you have a political objection to and replacing them with another set that you found lying around on the web. (fuente).

Posteriormente la versión de los alarmistas fue la contraria: no había razón para no haber usado en la reconstrucción regional de Briffa08 los datos que McIntyre había usado para demostrar que la forma de palo de hockey desaparecía al usar más datos. El propio Briffa reconoció que los datos empleados por McIntyre sí podían haber formado parte de la reconstrucción, pero argumentó que sencillamente en su momento no consideraron usar otros datos que los procedentes de Hantemirov y Shiyatov (fuente).

Sencillamente no consideraron usar más datos, afirmó Briffa… O cómo justificar el injustificable cherry-picking.

Our current practice when selecting data to incorporate in a regional chronology, is to include data exhibiting high levels of common high-frequency variability (i.e. on the basis of high inter-site correlations, where these are calculated using high-pass filtered data). Judged according to this criterion it is entirely appropriate to include the data from the KHAD site (used in McIntyre’s sensitivity test) when constructing a regional chronology for the area. However, we simply did not consider these data at the time, focussing only on the data used in the companion study by Hantemirov and Shiyatov and supplied to us by them. (fuente)

No tenía ningún sentido esta explicación, pues el artículo del año 2000 ya usaba sólo esos datos y supuestamente en el del 2008 estaban creando reconstrucciones regionales, que serían tanto mejores cuantos más datos emplearan. ¿Por qué autorrestringir la cantidad de datos? ¿De verdad para su artículo Briffa et al. sólo habían considerado los datos procedentes de Yamal, sin en ningún momento plantearse incorporar otros datos?

Gracias al Climategate (ver) tenemos respuesta a la pregunta anterior: un e-mail de 2006 confirma que sí habían trabajado con más datos en la reconstrucción de esa región, en concreto datos de los Polares Urales además de Yamal (fuente):

To: philip.brohan@xxxxxxxxx.xxx
From: Tim Osborn
Subject: Re: Standardisation uncertainty for tree-ring series
Cc: Keith Briffa ,simon.tett@xxxxxxxxx.xxx

Hi Philip,
we have three “groups” of trees:
“SCAND” (which includes the Tornetrask and Finland multi-millennial chronologies, but also some shorter chronologies from the same region). …

“URALS” (which includes the Yamal and Polar Urals long chronologies, plus other shorter ones). These fall mainly within these 3 boxes:
52.5E, 67.5N
62.5E, 62.5N (note this is the only one not at 67.5N)
67.5E, 67.5N

“TAIMYR” (which includes the Taimyr long chronology, plus other shorter ones). These fall mainly within these 4 boxes:
87.5E, 67.5N
102.5E, 67.5N
112.5E, 67.5N
122.5E, 67.5N

We do some analysis at the group scale, and for this we take the JJA temperatures from each box and average to the group scale to obtain a single series from each of SCAND,
URALS and TAIMY.

We do some analysis at the overall scale, and for this we take these three group temperature series and average them to get an overall NW Eurasia temperature for boxes
with tree chronologies in them…

El contenido de otro e-mail, éste del año 2007 confirma que manejaban los datos de los Urales Polares junto con los de Yamal (fuente,fuente).

¿Por qué dijeron que no se plantearon usar otros datos aparte de los de Yamal, cuando la verdad era que sí los habían considerado? Recordemos lo que habían afirmado públicamente: “sencillamente no consideramos esos datos y nos centramos en los datos que nos proporcionaron Hantemirov and Shiyatov”. No era verdad. Mentían: sí habían considerado otros datos.

¿Por qué si como mínimo desde el año 2006 manejaban los datos de los Urales Polares, estos no fueron incluidos en el artículo de 2008? ¿Por qué negaron haber manejado más datos? Cabe pensar que no tenían una buena excusa para por qué no los habían usado. La verdad, obviamente, era que el cherry-picking tenía como objetivo obtener una forma concreta en la reconstrucción.

But the subsequent Briffa et al (2008 Phil Trans B) only includes the very small Yamal data – without the long Polar Urals chronology or the shorter chronologies. Wonder why? Stephen McIntyre

En contradicción con sus otras afirmaciones, también afirmaron que sí consideraron usar más datos, algo esperable para lo que aspiraba a ser una reconstrucción de la región, pero que vieron que no les daba tiempo a incorporar esos otros datos al artículo:

we had intended to explore an integrated Polar Urals/Yamal larch series but it was felt that this work could not be completed in time and Briffa made the decision to reprocess the Yamal ring-width data to hand, using improved standardization techniques, and include this series in the submitted paper. (fuente)

La nueva excusa para el cherry-picking es que creyeron que no les daba tiempo a incluir más datos para una edición temática de la revista Philosophical Transactions of the Royal Society a la que habían sido invitados a colaborar y que tenía un deadline (fecha tope). En definitiva, por un lado decían que su propósito había sido usar sólo los datos de los dos rusos mientras que por otro lado decían que no era ése su objetivo pero que al final lo habían hecho así por falta de tiempo para procesar los datos. Se quedaron sin tiempo para incorporar unos datos que sabemos gracias al ClimateGate que manejaban al menos desde dos años antes (fuente) (mis negritas):

the purpose of the work reported in Briffa (2000) and Briffa et al. (2008) was to reprocess the existing dataset of Hantemirov and Shiyatov

we had intended to explore an integrated Polar Urals/Yamal larch series

¿Cuál es la explicación verdadera, la primera o la segunda? Ni había razones para lo primero ni les faltó tiempo para lo segundo. Ninguna de las dos explicaciones es creíble.

Usar los Urales Polares actualizados (en rojo) frente a usar sólo Yamal (en negro). Fijémonos en el año 1000. Sobran las explicaciones sobre qué perseguía el cherry-picking.

¿A Briffa et al. no se les ocurrió usar los Urales Polares? Sabemos que eso es falso. Nótese por otro lado en la gráfica anterior cómo la curva roja va hacia abajo en la parte final del siglo XX, demostrando que un árbol no es un termómetro (ver). Sin embargo, al evitar el uso de los Urales Polares Briffa et al. se permitían el lujo de afirmar que no habían encontrado la típica “divergencia” en sus datos. No había divergencia porque no quisieron usar otros datos más que los de Yamal.

¿Estaban mintiendo? Otro dato. Uno de los argumentos empleados por Briffa et al. para no entregar los datos usados en sus artículos a McIntyre es que esos datos no pertenecían al CRU sino que pertenecían a los dos rusos:

were obtained from their owners, and thus they were never CRU’s to “release” (fuente)

Pero los correos electrónicos del ClimateGate revelaron que esos datos habían sido pagados por el CRU (fuente), y que, por lo tanto, sí pertenecían al CRU —¡los habían pagado ellos!— y claramente sí podían compartirlos con McIntyre. Si querían, claro.

¿Estaban mintiendo?

Conclusiones

En resumen, lo que estamos viendo es que los criterios para usar unos árboles u otros no existían ex-ante (con anterioridad al suceso) y que cuando personas escépticas como McIntyre trataban de obtener los datos empleados para entender qué se había hecho en los artículos lo único que encontraban eran trabas. Si entregaban esos datos los críticos confirmarían que había otros datos disponibles y que no los usaron sin una razón objetiva establecida de antemano. Es decir, entregar los datos pondría en evidencia que habían hecho cherry-picking. Las excusas para hacer cherry-picking sólo convencen a los ya convencidos, que son los que quieren que el resultado sea un palo de hockey que haga desaparecer el Periodo Cálido Medieval (ver).

Y conviene poner en contexto lo que estamos viendo en esta entrada con lo que ya sabemos del palo de hockey de Mann et al. (ver): los alarmistas son incapaces de reconocer que el palo de hockey de Mann no tiene validez como prueba científica y en lugar de eso usan el argumento de que “las reconstrucciones posteriores confirman el resultado de la de Mann“. La realidad es que las reconstrucciones posteriores a la de Mann son la misma “mala ciencia con una misión”: son el fruto del cherry-picking y sus resultados dependen de que se usen ciertos árboles de los que se sabe que han tenido un comportamiento anómalo (Yamal en este caso) que no se explica por la temperatura (ver), del mismo modo que el palo de hockey original dependía de la inclusión de los pinos longevos parcialmente descortezados y el cedro de Gaspé (fuente), cuyo anómalo comportamiento en el siglo XX se sabía que no era causado por la temperatura. Ese comportamiento anómalo que se sabe que no lo causa la temperatura —hasta el punto de que en algunos casos desaparece en las versiones revisadas de los datos— es usado como prueba de que los árboles son termómetros y de que el exterminio climático se acerca. Es Kafkiano.

imagen_5316

Las supuestas confirmaciones independientes de independientes no tienen nada (fuente) y de pruebas sólidas tampoco tienen nada (fuente). Mucha mala ciencia no suma de forma constructiva sino destructiva. Si lo único que tienes es mucha mala ciencia lo que demuestras es que no eres capaz de encontrar pruebas científicas que respalden tu “misión”.

Los que promueven estos estudios como pruebas científicas hacen un flaco favor a la ciencia y sospecho que a la humanidad en su conjunto.

NOTA: en 2013 Briffa et al. publicaron una nueva cronología para Yamal que era prácticamente idéntica a los resultados obtenidos por McIntyre añadiendo datos procedentes de Khadyta River (fuente). Como vemos en la gráfica, la supersubida final en los datos había desaparecido. Los datos erróneos ya podían descansar tranquilos pues durante años habían cumplido su misión en el engaño climático.

¿Qué nos dice esto de todas las reconstrucciones que generaban la subida final gracias a los datos de Yamal? En esta página podemos encontrar una tabla con reconstrucciones que usaron esos datos que posteriormente de facto fueron reconocidos como erróneos. Y los catastrofistas calladitos ante toda esta mala ciencia. ¿De verdad creen que su silencio cómplice ante los actos perpetrados por otros alarmistas es compatible con su pretensión de estar defendiendo la ciencia?

imagen_5317

Para leer más sobre el tema:

4 comentarios sobre “La adicción al cherry-picking en la Iglesia de la Calentología

  1. The Polar Urals Update correlates better to gridcell temperature than the Yamal series and one cannot help but suspect that the decision to use the Yamal series in all studies except Esper has been done with one eye on the MWP-modern relationship.

    There is an updated version of the Polar Urals series, used in Esper et al 2002, which has elevated MWP values and which has better correlations to gridcell temperature than the Yamal series. since very different results are obtained from the Yamal and Polar Urals Updated, again the relationship of the Yamal series to local temperature is “ambiguous”.

    https://climateaudit.org/2009/10/05/yamal-and-ipcc-ar4-review-comments/

    Me gusta

  2. El arte del cherry-picking:

    The next graphic compares the RCS chronologies from the two slightly different data sets: red – the RCS chronology calculated from the CRU archive (with the 12 picked cores); black – the RCS chronology calculated using the Schweingruber Yamal sample of living trees instead of the 12 picked trees used in the CRU archive. The difference is breathtaking.

    Figure 2. A comparison of Yamal RCS chronologies. red – as archived with 12 picked cores; black – including Schweingruber’s Khadyta River, Yamal (russ035w) archive and excluding 12 picked cores. Both smoothed with 21-year gaussian smooth. y-axis is in dimensionless chronology units centered on 1 (as are subsequent graphs (but represent age-adjusted ring width). [Amended Sep 28 6 pm. Replaces url]

    https://climateaudit.org/2009/09/27/yamal-a-divergence-problem/

    Me gusta

  3. Primer mandamiento de la Iglesia de la Climatología: harás cherry-picking hasta cuando duermes, porque tienes una misión:

    In this study we eliminated the “divergence effect” in northern Alaska by careful selection of individual trees with consistently significant positive relationships with climate

    Haz clic para acceder a cpd-4-741-2008-print.pdf

    Escoges los árboles para que digan lo que quieres que digan: ¡¡y obtienes lo que buscabas!!

    Que bonita es LA CIENCIA.

    Me gusta

  4. Escoger los datos que van a dar el resultado que buscas tiene un nombre: cherry-picking.

    To be included in the current database, tree-ring data were required to correlate positively (P<0.05) with local or regional temperature (averaged over the entire year or over the growing season).

    There are approximately 3100 North American tree ring measurement datasets in the ITRDB database, from which 151 (4.9%) were selected as having a P<0.05 correlation with temperature – approximately the same percentage as one would expect from random data.

    While screening on the basis of correlation to temperature superficially seems to make sense, the error is easily understood if you hypothesize a pharmaceutical scientist using ex post screening: imagine a drug study which only reported results for patients who got better. Or a financial fund manager who only reports the investments that go up in value. Such a technique would be risible and the results misleading. The fallacy, in broader statistical literature, is commonly called screening on the dependent variable; studies which use this fallacious technique have no statistical validity.
    There is nothing wrong with hypothesizing ex ante that (for example) black spruce ring widths at treeline sites are a temperature-sensitive proxy. But once you have done so, you take your sample of all the trees you believe to be suitable and use all the resulting data. If you exclude sites in which ring widths go down in the 20th century, you can’t use the fact that the resulting series goes up in the 20th century as proof of anything, because such a technique will impart a hockey stick shape even to data which, on average, has no trend.

    Haz clic para acceder a Climategate.10YearsAfter.pdf

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s