Inicio España Un equipo de científicos del MNCN-CSIC ha desarrollado OCCUR, una aplicación para...

Un equipo de científicos del MNCN-CSIC ha desarrollado OCCUR, una aplicación para el análisis de datos biológicos de diferentes especies

0

MADRID, 4 (EUROPA PRESS)

Un equipo de investigadores del Museo Nacional de Ciencias Naturales (MNCN-CSIC) ha desarrollado OCCUR, una aplicación que permite conocer y establecer los criterios para filtrar, homogeneizar y validar registros biológicos de especies de acuerdo con cada estudio científico.

En la actualidad, los repositorios de datos masivos como ‘Global Biodiversity Information Facility’ (GBIF) permiten, según ha explicado la investigadora del MNCN, Cristina Ronquillo, que los investigadores puedan “evaluar ciertos aspectos del estado de la biodiversidad reduciendo los costes y recursos que implican los muestreos”.

Sin embargo, el problema, como ha destacado Ronquillo, es que para utilizar correctamente esos datos almacenados en repositorios de acceso libre o portales “es necesario tomar unas medidas determinadas porque el criterio de cada recolector es diferente”.

Ante esta situación, el equipo del MNCN-CSIC ha creado OCCUR con el objetivo de promover, según ha explicado la investigadora, “una serie de buenas prácticas y protocolos en los procesos de limpieza y preparación de datos tal y como se haría en cualquier otra fase del análisis científico”.

En concreto, según ha detallado, cuando se utilizan datos de estos repositorios hay que tener en cuenta las limitaciones de los registros debido a los sesgos e imprecisiones que incluyen, así como su estandarización y armonización. Por ejemplo, si todos los registros están identificados a nivel de especie, si incluyen el autor del nombre científico, si las medidas están estandarizadas o detectar si el registro ha sido georreferenciado con las coordenadas de una ciudad cercana y o del lugar de muestreo.

También es importante, como ha añadido el investigador del MNCN, Joaquín Hortal, revisar los criterios para descargar o seleccionar determinados registros en función del estudio. En ese contexto, el equipo del MNCN-CSIC, en su trabajo diario con ecólogos, se dio cuenta de que había cierto desconocimiento de “un gran número de criterios y herramientas que podían implementarse para trabajar con esta información”.

Como ha destacado Hortal, el proceso de depuración de datos ha de enfocarse en seleccionar aquellos que sean útiles para “responder a la pregunta que se han planteado y no en obtener los mejores datos”.

Así, la aplicación OCCUR pone a disposición de la comunidad científica una herramienta “fácil de usar” que permite a quienes investigan conocer los caminos posibles a la hora de tratar los datos para valorar cuáles incluir en función de la cantidad y calidad de los registros disponibles.

En concreto, sintetiza los criterios y métodos de procesamiento de registros propuestos por 25 trabajos anteriores y los agrupa en cinco módulos: tipo de naturaleza del registro, taxonomía, geografía, información temporal y detección de duplicados.

Al final, OCCUR genera un informe en el que aparecen los pasos seleccionados en cada caso, lo que facilita el desarrollo de los análisis y la inclusión, organización y escritura de los métodos en el artículo científico que describa el estudio en cuestión. “Cabe destacar que, en aquellos casos en que ha sido posible, ‘OCCUR’ también proporciona código en el lenguaje estadístico R para ser incluido en los análisis de cada usuario”, ha puntualizado Ronquillo.

EL CASO PRÁCTICO DE LOS MUSGOS

La utilidad de OCCUR se ha comprobado en un trabajo recientemente publicado en la revista ‘Ecology and Evolution’, que analizaba los más de 9 millones de registros de musgos disponibles para la región templada del hemisferio norte.

Los resultados de este trabajo destacan que los diversos métodos de procesamiento de registros mostraron diferencias notables en la diversidad de especies observadas en determinadas áreas de Europa y norte América, y con ello variaciones en las relaciones entre clima y biodiversidad medidas a partir de estos datos masivos.

“Esto tiene consecuencias importantes, ya que significa que la calidad de los datos de partida que utilizamos para calibrar los modelos del impacto del cambio global puede alterar sus predicciones, lo que pone en evidencia la necesidad de realizar un trabajo minucioso con el procesamiento de los datos masivos de biodiversidad, que puedan replicar otros investigadores en el futuro”, ha concluido Hortal.


- Te recomendamos -