Une collection n’est d’intérêt scientifique que si les objets biologiques sont accompagnés de certaines informations (provenance géographique, identification, etc.). Parfois, ce sont des connaissances et des savoirs associés qu’il faut gérer (usages et pratiques agricoles, représentations, noms vernaculaires, etc.). Ces informations et connaissances associées aux collections nécessitent des outils de gestion de données hétérogènes.
Les sciences de la nature se caractérisent par la grande masse des données qu'elles produisent : observations sur le terrain, échantillons, référentiels... L'évolution rapide de l'informatique permet d'envisager une valorisation de ces données à tous les niveaux, depuis le chercheur ou la collection isolée jusqu'au monde entier. Mais les défis sont nombreux.
Le premier de ces défis est d’informatiser les collections pour rendre disponibles les données liées aux échantillons et permettre une meilleure exploitation de ces réservoirs d’informations pour les besoins de la recherche comme pour ceux de la société en général. De nombreuses collections, pour lesquelles cette démarche a été engagée parfois depuis plusieurs décennies, sont d’ores et déjà informatisées et leurs données consultables sur internet. Pour d’autres, le travail — parfois colossal — reste encore à faire. Le projet E-ReColNat vise à combler ce retard pour les herbiers, notamment pour MPU et l’herbier ALF du Cirad.
Un deuxième défi est de permettre des recherches simultanées sur toutes ces bases de données naturalistes, créées indépendamment les unes des autres, et donc avec des formats de données et des systèmes de gestion extrêmement hétérogènes. Pour y répondre, le groupe de travail international Biodiversity Standards (Taxonomic Database Working Group)*, dont Montpellier a accueilli le congrès de 2010, propose des normes et des formats d’échange de données. Grâce à ces standards, le portail internet du Global Biodiversity Information Facility (GBIF)** offre un accès unique à un nombre croissant de bases de données dans le domaine de la biodiversité.
Mais ces standards techniques, quoiqu’indispensables, ne sont pas suffisants. Il est également nécessaire d’élaborer des référentiels taxinomiques communs, ce qui est loin d'être une tâche triviale, tant le niveau des connaissances est hétérogène selon les taxons et les zones géographiques. Sur ce plan là également, des initiatives internationales tentent, avec plus ou moins de succès, de fédérer les référentiels les plus utilisés. Ainsi, pour les plantes vasculaires (plantes à fleurs, conifères, fougères et mousses), le portail « The Plant List »***, lancé en 2010, regroupe près de 1,3 millions de noms scientifiques provenant de nombreuses sources régionales, nationales et internationales.
En France, Tela Botanica (Montpellier) gère un référentiel de la flore de France et est chargée par le ministère de l'Environnement de coordonner les référentiels pour les champignons, les algues, les lichens et pour la flore de l’outre-mer français.
Un dernier défi porte sur les outils permettant au chercheur individuel ou à l’amateur de gérer ses propres données, tout en échangeant avec les divers serveurs sur internet. Les informations à gérer peuvent être très diverses : données textuelles, cartes et surtout photos. Avec le numérique, les photos deviennent faciles à prendre et leur nombre explose. Les voies de leur valorisation se diversifient : identification participative, reconnaissance d'images, etc.
Dans le domaine de la botanique, Pl@ntNet**** a été créé pour répondre à ces défis. Parmi les principales réalisations en cours, figurent notamment un gestionnaire de données facilitant la production, le partage et l’agrégation de données de tout type sur les plantes, ainsi que des outils d’identification automatique ou assistée, de validation collaborative des informations, etc.
Les grandes quantités de données hétérogènes peuvent aussi être produites et gérées de façon collaborative grâce à des wikis. C’est le cas du projet Pl@ntUse*****, cas d’étude de Pl@ntNet dédié aux plantes utiles, qui bénéficie des fonctionnalités du moteur Mediawiki.