Los ajustes convenientes (I)

La temperatura media del planeta

Hay tres grandes reconstrucciones de temperatura media del planeta: la de la NOAA, la del NASA/GISS y la de la CRU:

Como se resume en la gráfica anterior, esencialmente todas las reconstrucciones usan los mismos datos de partida (fuente), que son los proporcionados por la Global Historical Climate Network (GHCN). Sólo un 1-2% de los datos que usan la NASA y CRU proceden de estaciones de medida no procedentes de la GHCN (fuente,fuente). Desde 2011 el GISS usa datos ya homogeneizados (o ajustados, términos intercambiables) por la NOAA (fuente). Y, además, tanto el NASA/GISS como la CRU realizan sus propios ajustes adicionales.

¿Se puede corregir un error que se desconoce?

No, no se puede. No hay algoritmo ni teorema que garantice la corrección de un error de propiedades desconocidas.

variance reduction by appeal to the CLT is justified when the overall distribution of error is known to be random. However, there is no a priori reason to expect that systematic errors should be normally distributed at any N. Patrick Frank

la reducción de varianza apelando al teorema del límite central está justificado cuando la distribución del error se sabe que es aleatoria. Sin embargo, no hay razones a priori para esperar que los errores sistemáticos tengan una distribución normal con ningún N.

Parece contraintuitivo. Los que no sabemos mucho del tema tendemos a pensar que las medidas de termómetro son fiables y que su procesamiento es sencillo, riguroso y sin razones para ser cuestionado:

¿Qué error puede tener la lectura de un termómetro, medio grado centígrado como mucho? Pues al usar muchos datos procedentes de termómetro los errores de lectura se reducen y asunto resuelto. ¿Quién dice que la lectura de un termómetro tiene un error desconocido? ¿Acaso nos va a dar 10ºC más que la temperatura real? No, el error está acotado luego se reducirá al promediar.

Como vamos a ver, el planteamiento anterior es erróneo.

Si una estación meteorológica es cambiada de ubicación, ¿cómo cambian las medidas de esa estación? Y si el operario de la estación cambia la hora a la que realiza la lectura, ¿cómo cambian las medidas? Y si la zona en la que está la estación es progresivamente urbanizada, con cada vez menos vegetación alrededor y más cemento, ladrillo y asfalto, ¿cómo cambian las medidas? Y si alguien planta o tala un árbol que da/daba sombra cierta parte del año a la instrumentación de medida, ¿cómo cambian las medidas? Y no sólo se trata de cuantificar el sesgo introducido en los datos una vez se detecta una posible fuente de sesgo, sino de que quizá ni siquiera consta que se haya producido esa circunstancia potencialmente problemática. ¿Se puede corregir un sesgo “no documentado”?

Y no sólo las medidas tienen problemas. Si los que gestionan los datos deciden eliminar gran parte de las estaciones por considerarlas poco fiables, ¿cómo cambian las medidas? Supongamos por ejemplo que gran parte de las estaciones eliminadas son rurales y están a más altura sobre el nivel del mar que las que sí son consideradas fiables, que son en general más urbanas, ¿cómo cambian las medidas por tomar esa decisión?

Si se puede estimar el error o alguna de sus características, se puede reducir algo éste, pero en muchos casos el error no se conoce, por lo que la corrección no es posible y el procesado no necesariamente acerca los datos medidos al valor real.

Los datos de la GHCN

Siendo que, como hemos visto, las tres reconstrucciones más importantes usan los mismos datos, la calidad de esos datos así como el procesado con el que se suministran son muy relevantes. En este sentido, de acuerdo con Ross McKitrick (fuente) en las últimas décadas se ha reducido drásticamente el número de estaciones empleadas en las reconstrucciones:

En sí mismo, eso ya reduce la fiabilidad del resultado, pues inevitablemente se reduce la cobertura, pero además introduce otros sesgos, pues con la eliminación de estaciones ha quedado:

  • Mayor porcentaje de estaciones situadas en aeropuertos.
  • Mayor porcentaje de estaciones en latitudes cálidas.
  • Mayor porcentaje de estaciones en baja altitud.

Quizá por casualidad, hay un notable cambio en las temperaturas (barras marrones) justo en el momento en que abruptamente descience el número de estaciones consideradas (círculos azules) (fuente):

Nótese que el cambio de tendencia en 1990 parece un artefacto que afecta especialmente a las estaciones rurales (fuente):

La homogeneización

¿Es importante que los datos sean “ajustados”? Como mínimo es importante que sepamos que

  1. los datos de termómetro son menos fiables de lo que podríamos pensar, y que
  2. los ajustes que se realizan no necesariamente aumentan la exactitud. Pueden incluso reducirla.

La gráfica muestra cómo el ajuste realizado por NOAA (versión 2) introduce un calentamiento de 0.3 ºC /siglo en los datos:

En la gráfica anterior también se ve —como resalta Ross McKitrick— un extraño calentamiento introducido en la década de los 90, pues 0.1 ºC se introducen en esos años de forma abrupta.

En la versión 3 del ajuste de NOAA vemos que también se introduce calentamiento :

Algunos ajustes son razonables (relacionados con el cambio en el instante de observación del termómetro o con un cambio en el tipo de termómetro en estaciones concretas), pero otros ajustes cambian las medidas sin pretensión de estar corrigiendo un error conocido documentado en el historial de una estación concreta, sino supuestos errores inferidos de forma automatizada por comparación con las estaciones vecinas. No entro a valorar el algoritmo y remito al apartado 1.1.2 de esta fuente y los apartados 4.1-4.3 de esta fuente. ¿Y cómo saben que la versión modificada es mejor que la versión sin modificar, si no saben si realmente había un error ni su magnitud? ¡Un error desconocido no se puede corregir!

Por ejemplo, supongamos que tenemos una estación rural cuyo registro de temperatura está relativamente libre de sesgos, rodeado de otras estaciones también consideradas rurales pero que tienen un sesgo de urbanización parecido entre ellas. ¿Qué es más probable que haga en esta situación un algoritmo que interpreta diferencias respecto de la mayoría de estaciones vecinas como errores, reducir o agravar el problema?

The problem arises from the assumption that the mean temperature trends of a station’s neighbours, on average, “…accurately reflected the climate of the region so that any significant departures from climatology could be directly associated with discontinuities in the station data” (Peterson & Vose, 1997[12]).

Si muchas de las estaciones tienen sesgos parecidos, por ejemplo de urbanización, el algoritmo no eliminará el sesgo de las más afectadas, como mucho lo reducirá algo, dejándolo al mismo nivel que sus vecinas. El sesgo no será eliminado. Homogeneizar no significa sin sesgos, significa hacer más parecidas las medidas, para bien o para mal.

In version 3 of the GHCN‐M temperature data, the apparent impacts of documented and undocumented inhomogeneities are detected, and corrected for (fuente)

¿Están seguros de que corregir inhomogeneidades “no documentadas” es corregir errores?

Cambios en el instante de observación

La explicación de este efecto es la siguiente: en los termómetros que miden temperatura mínima y máxima, y la temperatura media del día anterior se aproxima como el valor medio de mínima y máxima. Pero la medida de mínima y máxima se ven influenciadas por el instante del día en que el termómetro se observa (y se reinicia). Ha sucedido que cada vez más operarios de estaciones han realizado la observación por la mañana en lugar de por la tarde (porque se pidió que hicieran ese cambio) y eso introduce un pequeño enfriamiento en las medidas. Por tanto, su corrección supone calentar las medidas. Además, las tendencias han sido diferentes en zonas rurales y urbanas.

Comentario final

Y un comentario más: cuando los datos tienen errores que no se pueden corregir, quizá corregir los que sí son corregibles lo que hace es aumentar la magnitud del error.

Por ejemplo, supongamos que el sesgo de urbanización aumenta de forma progresiva la temperatura por estación en +0.5 ºC por siglo que no son reales, pero tampoco fácilmente cuantificables y, por tanto, difícilmente corregibles. Y, supongamos que el cambio en el momento de observación introduce -0.2 ºC por siglo que sí son corregibles. En este supuesto:

  • si no se toca nada, los datos tienen un calentamiento irreal de +0.3 ºC por siglo.
  • Corregir el sesgo del momento de observación deja el error en un extra de +0.5 ºC  por siglo (que no deberían estar en los datos porque no son reales), que es mayor que el error que hay si no se corrige nada.

Sigo en la segunda parte.

NOTA: Posiblemente el sesgo de Isla Térmica Urbana no pueda ser corregido, pues para ello sería necesario conocer cuál sería la evolución de la temperatura en una estación de no haber sido progresivamente urbanizados sus alrededores.

NOTA: Para leer sobre la fiabilidad de las reconstrucciones de temperatura media del planeta, recomiendo leer:

Y estos cuatro para los que quieran más detalles:

Leer más:

7 comentarios sobre “Los ajustes convenientes (I)

  1. We strongly disagree with the National Climatic Data Center about the reliability of their step-change adjustments. In our Urbanization bias III paper, we show that their adjustments are seriously inappropriate for dealing with urbanization bias, and actually end up spreading the urbanization bias into the rural station records

    https://globalwarmingsolved.com/2013/11/summary-has-poor-station-quality-biased-u-s-temperature-trend-estimates/

    Me gusta

  2. ¿Por qué las estaciones meteorológicas urbanas muestran más calentamiento que las rurales?

    we found that the subset of urban stations showed about 0.52°C/century more warming than the subset of rural stations. So, the relative warmth of the recent warm period should probably be reduced somewhat, to account for urbanization bias.

    Me gusta

  3. El efecto isla de calor aparece en pueblos pequeños. La temperatura varía por centímetros con la inversión térmica. Así que datos 100% fiables por eso no me creo las gráficas de pronóstico, el margen de error es brutal, además que muestran el escenario que interesa.
    Series largas como las que hay en Inglaterra, las más antigua. En España tenemos el Fabra en Barcelona, pero aunque esta en la montaña hay muchos expertos que creen que el calor de la ciudad sube allí, así que tampoco seria una gran referencia

    Me gusta

    1. Hola,

      sí, parece que los termómetros en zonas con poca población son los que pueden sufrir calentamientos ficticios de mayor magnitud:

      Sin datos (metadatos) anuales de población en cada estación meteorológica parece imposible hacer una corrección del sesgo de urbanización. Y aunque esos metadatos existieran, no tengo claro en qué medida la corrección sería fiable.

      Es razonable sospechar que los fanáticos hacen los ajustes que les interesa y no hacen los que no les interesa.

      Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s