Cuando se trabaja con grandes bases de
datos de vegetación con procedencia muy diversa, la taxonomía puede
jugarnos una mala pasada. En estas bases de datos es frecuente
encontrar: (1) especies que se llaman de distinta forma pero que en
realidad son la misma (sinónimos); (2) especies con el mismo nombre
pero que en realidad son distintas (homónimos); (3) errores
tipográficos, que hacen muchas veces que registremos como distintas, especies que ya han sido registradas en la misma base de datos.
En consecuencia es necesario estandarizar la taxonomía. The PlantList (TPL) es una iniciativa que permite poner un poco de orden en
todo este caos que suponen los sistemas nomenclaturales (aunque obviamente no está exenta de errores).
En TPL se puede ingresar el nombre de una planta y te dice si dicho nombre está aceptado, es sinónimo de otro o está todavía sin resolver. En caso de que no aparezca en TPL es muy probable que haya un error tipográfico, aunque a veces simplemente ocurre que el nombre en cuestión todavía no ha sido ingresado en la base de datos. La principal limitación con el uso de este portal web, es que la validación hay que hacerla nombre por nombre, lo que supone una carga de trabajo muy alta cuando tenemos listas enormes de nombres de plantas.
En TPL se puede ingresar el nombre de una planta y te dice si dicho nombre está aceptado, es sinónimo de otro o está todavía sin resolver. En caso de que no aparezca en TPL es muy probable que haya un error tipográfico, aunque a veces simplemente ocurre que el nombre en cuestión todavía no ha sido ingresado en la base de datos. La principal limitación con el uso de este portal web, es que la validación hay que hacerla nombre por nombre, lo que supone una carga de trabajo muy alta cuando tenemos listas enormes de nombres de plantas.
Pues bien, en el marco del proyecto
BIOTREE-NET, una iniciativa que trata de compilar y estandarizar
información de árboles en inventarios forestales para toda
Centroamérica, he diseñado una función en R que te permite hacer
todo este trabajo de forma automatizada. Esto ahorra mucho trabajo
manual y puedes cotejar miles de nombres en poco tiempo (unas horas
como mucho). La función (TPL) se presenta dentro de paquete de R
con el mismo nombre, y utiliza a su vez otra función (TPLck) que
hace el cotejo para nombres individuales.
El procedimiento está resumido en el
siguiente esquema (que he preparado para una posible publicación):
El paquete se puede descargar aquí en
*.tar.gz (Linux):
o *.zip (Windows):
El resultado de aplicar la función TPL a un listado de nombres de plantas
es un arreglo de datos (data.frame) con información sobre el estatus
del nombre según The Plant List, el nombre actualizado (en caso de
sinónimos o errores tipográficos), la familia y la autoridad, entre otras cosas.
Las principales limitaciones hasta el
momento son que: (1) no es posible resolver el problema de los
homónimos; (2) las correcciones de errores tipográficos sólo se
realizan cuando los errores existen en el epíteto específico. Si
los errores se producen en el género o en el epíteto
infraespecífico, no hay nada que hacer; (3) en el caso de que una
especie sea sinónima de otra y mantenga el mismo nombre cambiando
sólo la autoridad (ej. Bartramia pomiformis var. elongata Turner como
sinónimo de Bartramia pomiformis var. elongata Hedw.), el procedimiento
extráe finalmente la autoridad del sinónimo (Turner) y no del
nombre aceptado (Hedw.); (4) en el caso de que haya muchos epítetos
infraespecíficos y ninguno se corresponda con el nombre que estamos
validando, la función busca por defecto el nombre de la especie que
NO tenga epíteto infraespecífico. Si este nombre no existe en TPL
el nombre se queda sin resolver (pero se da una advertencia al
usuario para que pueda revisar este nombre a posteriori).
Si alguien prueba el paquete y detecta
algún error o se le ocurre alguna mejoría posible, por favor que no
dude en contactarme.
No hay comentarios:
Publicar un comentario