viernes, 27 de enero de 2012

Un método automatizado para la estandarización taxónomica de nombres de plantas con The Plant List (TPL)


Cuando se trabaja con grandes bases de datos de vegetación con procedencia muy diversa, la taxonomía puede jugarnos una mala pasada. En estas bases de datos es frecuente encontrar: (1) especies que se llaman de distinta forma pero que en realidad son la misma (sinónimos); (2) especies con el mismo nombre pero que en realidad son distintas (homónimos); (3) errores tipográficos, que hacen muchas veces que registremos como distintas, especies que ya han sido registradas en la misma base de datos. En consecuencia es necesario estandarizar la taxonomía. The PlantList (TPL) es una iniciativa que permite poner un poco de orden en todo este caos que suponen los sistemas nomenclaturales (aunque obviamente no está exenta de errores).

En TPL se puede ingresar el nombre de una planta y te dice si dicho nombre está aceptado, es sinónimo de otro o está todavía sin resolver. En caso de que no aparezca en TPL es muy probable que haya un error tipográfico, aunque a veces simplemente ocurre que el nombre en cuestión todavía no ha sido ingresado en la base de datos. La principal limitación con el uso de este portal web, es que la validación hay que hacerla nombre por nombre, lo que supone una carga de trabajo muy alta cuando tenemos listas enormes de nombres de plantas.

Pues bien, en el marco del proyecto BIOTREE-NET, una iniciativa que trata de compilar y estandarizar información de árboles en inventarios forestales para toda Centroamérica, he diseñado una función en R que te permite hacer todo este trabajo de forma automatizada. Esto ahorra mucho trabajo manual y puedes cotejar miles de nombres en poco tiempo (unas horas como mucho). La función (TPL) se presenta dentro de paquete de R con el mismo nombre, y utiliza a su vez otra función (TPLck) que hace el cotejo para nombres individuales.

El procedimiento está resumido en el siguiente esquema (que he preparado para una posible publicación):

El paquete se puede descargar aquí en *.tar.gz (Linux):


o *.zip (Windows):


El resultado de aplicar la función TPL a un listado de nombres de plantas es un arreglo de datos (data.frame) con información sobre el estatus del nombre según The Plant List, el nombre actualizado (en caso de sinónimos o errores tipográficos), la familia y la autoridad, entre otras cosas.

Las principales limitaciones hasta el momento son que: (1) no es posible resolver el problema de los homónimos; (2) las correcciones de errores tipográficos sólo se realizan cuando los errores existen en el epíteto específico. Si los errores se producen en el género o en el epíteto infraespecífico, no hay nada que hacer; (3) en el caso de que una especie sea sinónima de otra y mantenga el mismo nombre cambiando sólo la autoridad (ej. Bartramia pomiformis var. elongata Turner como sinónimo de Bartramia pomiformis var. elongata Hedw.), el procedimiento extráe finalmente la autoridad del sinónimo (Turner) y no del nombre aceptado (Hedw.); (4) en el caso de que haya muchos epítetos infraespecíficos y ninguno se corresponda con el nombre que estamos validando, la función busca por defecto el nombre de la especie que NO tenga epíteto infraespecífico. Si este nombre no existe en TPL el nombre se queda sin resolver (pero se da una advertencia al usuario para que pueda revisar este nombre a posteriori).

Si alguien prueba el paquete y detecta algún error o se le ocurre alguna mejoría posible, por favor que no dude en contactarme.

lunes, 16 de enero de 2012

Apoyo a la ciencia en la declaración de la Renta

El editorial de la revista científica Nature de Diciembre de 2011 llamaba a los nuevos gobiernos de España, Italia y Grecia a invertir más en Ciencia. Según los analistas, invertir en ciencia ahora hubiese traído beneficios desproporcionados. Impulsar la ciencia en el sur de Europa, decían, no sólo beneficiaría a estos países, si no que harían toda Europa más competitiva.

Dicho y hecho; continuando la tradición de los últimos años del gobierno Zapatero, el nuevo Gobierno de Rajoy en España ha anunciado un recorte de 600 millones de Euros en I+D+i. El presupuesto para 2011 (8600 millones) era ya un 8% menor que en 2010, a su vez 15% inferior que el de 2009. Queda claro entonces que este nuevo recorte deja a la Ciencia española en una situación de emergencia, en un contexto de crisis económica y política nacional. También hay que tener en cuenta al estudiar esas cifras que buena parte del I+D español financia investigación en tecnología militar, con lo que el dinero dedicado al tipo de investigación que querrían mayoritariamente los españoles es incluso menor. La investigación y la innovación son pilares fundamentales para el desarrollo de una sociedad moderna, y hemos demostrado muchas veces que los científicos españoles podemos ser tan buenos como los del resto de países si nos dan la oportunidad.  Por ello, el científico español Francisco J. Hernández ha impulsado una iniciativa para pedir a nuestros políticos que podamos elegir destinar el 0.7% de nuestros impuestos a la ciencia. Si esta iniciativa prospera, seríamos el primer país del mundo en el que los ciudadanos elegirían qué parte de sus impuestos se destinasen de forma explícita a I+D+i.

La revista Nature en su editorial de enero se hacía eco de esta iniciativa y clamaba que los científicos españoles habíamos conseguido en menos de una semana cerca de 32.000 firmas. Pues bien, el apoyo a esta iniciativa sigue creciendo y, tras poco más de dos semanas ya se cuenta con más de 138.000 firmas.

Buscar entradas