Ressources pour la gestion de données
Vous avez des données à partager avec le SIOOC, mais vous avez quelques interrogations ? Vous êtes au bon endroit ! Dans cette section, nous répondons à quelques questions qui vous sont peut-être venues à l’esprit. (Et si vous en avez encore ou si vous souhaitez commencer à soumettre des données, envoyez-nous un courriel afin que nous puissions vous mettre en contact avec un spécialiste en gestion de données qui sera ravi de vous aider).
Contribuez au SIOOC et participez aux efforts visant à rendre les données océaniques plus accessibles.
Le SIOOC rassemble des jeux de données, rendant les données côtières et océaniques trouvables, accessibles, interopérables et réutilisables pour ceux qui en ont besoin.
Une bonne gestion des données océaniques profite à tous les utilisateurs des océans. La gestion des données avec le SIOOC permet de s’assurer que vos données peuvent être découvertes, ce qui augmente la valeur de vos données et réduit la probabilité de duplication. Chaque observation à travers les années contribue à notre compréhension des océans et peut être cruciale pour identifier et décrire les tendances durant une période de temps où on peut constater des changements.
Les données intégrées dans le SIOOC font l’objet d’une évaluation de qualité. Ce processus permet de s’assurer que les métadonnées sont complètes au niveau des normes internationales et de détecter les erreurs de saisie. Les outils de visualisation du SIOOC assurent également aux utilisateurs la qualité des données avant de les télécharger afin de s’assurer qu’elles répondent à leurs besoins.
Toutes les données du SIOOC suivent les mêmes normes, ce qui permet de comparer plus facilement des pommes avec des pommes et des oranges avec des oranges. Le SIOOC permet donc aux utilisateurs d’accéder facilement aux informations dont ils ont besoin pour prendre des décisions.
Tout au long du processus de votre projet, planifier et prendre des mesures pour sécuriser vos données peut être bénéfique pour vos pairs, localement ou mondialement, et pour les générations à venir.
Le SIOOC est un partenariat national concentré sur l’expertise en matière de gestion des données océaniques. La structure nationale est composée de trois associations régionales. Elle garantit que nous sommes en communication régulière avec notre équipe à travers le pays afin de résoudre tout problème et d’améliorer le SIOOC pour tous.
Si vous envoyez un courriel à info@cioos.ca, nous veillerons à ce que vous soyez mis en contact avec le personnel de la région qui peut le mieux répondre à vos besoins.
Si vos données sont collectées sur ou dans les océans, vous êtes au bon endroit et nous sommes impatients de vous aider. Plus précisément, le SIOOC recherche des données liées, mais non limitées, aux variables océaniques essentielles qui sont utiles à de nombreux utilisateurs canadiens des océans et qui soutiennent les efforts visant à mettre en place un système mondial d’observation des océans.
Ceci étant dit, certains types de données nécessitent un traitement particulier (par exemple, les données génomiques ou biologiques) et il peut être préférable de soumettre vos données à un dépôt plus spécifique, puis de créer un lien vers ces données par l’intermédiaire du SIOOC afin d’en améliorer l’accessibilité.
Si vos données ne sont pas des observations par rapport aux océans, vous pouvez envisager de vérifier auprès d’une revue spécialisée pour obtenir ses recommandations ou envisager de soumettre vos données aux dépôts de recherche plus généraux du Canada, Borealis ou le Dépôt de données de recherche fédéré.
Dans le monde de la gestion des données, ces termes ont des significations spécifiques qui requièrent un stockage des données pendant au moins 10 ans. À l’heure actuelle, les cycles de financement du SIOOC ne peuvent garantir cette longévité. Cela dit, le SIOOC s’efforce d’aider la communauté océanographique à accéder aux données aujourd’hui, demain et aussi longtemps que le financement sera assuré. Votre contribution aux données peut nous aider à nous développer et à rendre le SIOOC trop nécessaire pour être perdu.
Si vous avez besoin d’une solution de stockage sur plus de 10 ans, le SIOOC peut encore vous aider ! Vérifiez auprès d’une revue scientifique pour connaître leurs recommandations ou envisagez de soumettre vos données aux dépôts de recherche plus généraux du Canada comme Borealis ou le Dépôt de données de recherche fédéré. Une fois que les données sont sur un serveur, aidez la communauté maritime à les découvrir en soumettant les métadonnées au SIOOC. Les utilisateurs seront alors dirigés vers le dépôt approprié.
Le SIOOC adhère aux meilleures pratiques actuelles en matière de gestion des données. Dans la mesure du possible, nous suivons les principes FAIR (trouvables, accessibles, interopérables, réutilisables) et les principes TRUST (transparence, responsabilité, centrage sur l’utilisateur, durabilité et technologie). Notre application des principes FAIR dans nos pratiques de gestion des données tient également compte des sensibilités que les producteurs de données peuvent exprimer à propos de leurs données.
Outre les principes mentionnés dans la section précédente, le SIOOC suit les meilleures pratiques en matière de gestion des données qui concernent spécifiquement celles des communautés autochtones. Il s’agit des principes CARE (Collectivement bénéfique, Autorité de contrôle, Responsabilité, Éthique) et des principes PCAP (Propriété, Contrôle, Accès, Possession) développés par les Premières Nations. Ces principes reconnaissent et respectent le fait que les détenteurs de données contrôlent leurs données et la manière dont elles peuvent être stockées, utilisées ou partagées.
Nous travaillons avec nos partenaires des communautés autochtones pour nous assurer que des mécanismes appropriés reflétant ces contrôles sont en place et nous continuerons à les développer si nécessaire pour répondre aux besoins de nos partenaires.
Pour soutenir le mouvement en faveur de l’ouverture des données, le SIOOC propose trois licences que les fournisseurs de données peuvent choisir.
- Creative Commons Attribution 4.0 International licence (CC-BY 4.0) – recommandée par le SIOOC. Elle permet le partage et l’adaptation des données à condition que le fournisseur original soit cité.
- Creative Commons 0 – n’impose aucune restriction.
- Open Government Licence – Canada – Pour les jeux de données mis à disposition par les ministères et agences du gouvernement du Canada, cette licence est très similaire à CC-BY car elle permet le partage et l’adaptation des données, à condition que le fournisseur original des données soit correctement identifié.
Les licences sont attribuées aux jeux de données lors de la soumission des métadonnées.
Le SIOOC recherche actuellement des moyens de rendre les données restreintes trouvables, mais avec une accessibilité limitée.
Faites-nous savoir si vous souhaitez participer à ce projet à l’adresse info@cioos.ca.
Vous avez peut-être déjà soumis vos données à une autre plateforme… Félicitations ! Il n’est pas nécessaire de tout soumettre à nouveau au SIOOC. Cependant, vous pouvez rendre vos données plus faciles à trouver pour les utilisateurs en soumettant les métadonnées au SIOOC et en créant un lien vers l’autre dépôt. Pour ce faire, vous pouvez ajouter une entrée à l’aide de notre outil de saisie de métadonnées.
Les métadonnées sont les données nécessaires pour comprendre les données elles-mêmes. Elles vont du titre et du résumé des données à la date de collecte de l’échantillon, en passant par le nom des variables observées. Sans métadonnées suffisantes et cohérentes, il est difficile pour les utilisateurs de trouver et de comparer des observations similaires.
Le SIOOC a adopté des normes internationalement reconnues pour les métadonnées (ISO 19115-1:2014,19115-2:2019, and 19115-3:2016) qui permettent aux données du SIOOC d’être utilisées en conjonction avec d’autres systèmes d’observation des océans à travers le monde.
Pour garantir la cohérence des données du SIOOC, les soumissions de métadonnées passent par un outil de saisie des métadonnées basé sur le web. Il guide les fournisseurs de données à travers les champs obligatoires et facultatifs et facilite la traduction.
Le SIOOC est une plateforme entièrement bilingue. Pour que la découverte soit possible, toutes les données soumises au SIOOC doivent avoir des métadonnées complètes, dans les deux langues nationales. Nous avons développé un outil de saisie des métadonnées qui vous aide, en tant que fournisseur de données, à traduire les champs de métadonnées pertinents. Nous vous encourageons à vérifier les traductions générées par l’ordinateur avec des experts dans le domaine qui ont de l’expérience dans l’autre langue.
La réponse courte est : peut-être. Le SIOOC n’est pas une archive de données et ne dispose pas des ressources nécessaires pour héberger tous les jeux de données sur ses serveurs. La plupart des données du SIOOC sont stockées ailleurs et rendues accessibles par l’intermédiaire du SIOOC. Cela présente l’avantage de réduire le nombre de copies de données existantes. Si le fournisseur met à jour un jeu de données dans son propre système, ces changements sont automatiquement disponibles à tous les utilisateurs du SIOOC.
N’hésitez pas à nous contacter à l’adresse info@cioos.ca si vous souhaitez discuter des besoins de votre (vos) jeu(x) de données spécifique(s).
Les données stockées sur les serveurs du SIOOC doivent, dans la mesure du possible, être formatées dans des formats libres, tels que :
- CSV
- fichiers texte tabulaires
- JSON
- fichiers NetCDF
Une liste complète des types de fichiers d’entrée est disponible ici.
Les données présentes dans les feuilles de calcul Excel devront être transformées.
Les données en temps réel nécessitent une API ou une URL publique pour un accès régulier et toutes les transformations de données doivent être entièrement automatisées.
L’accès aux données brutes nécessite une URL publique de l’ensemble de données dans sa forme originale, provenant du fournisseur de données. Idéalement, le fournisseur de données peut fournir une URL publique ou un accès API.
Rendre les métadonnées interopérables signifie que les jeux de données peuvent être trouvés par d’autres plateformes au-delà du SIOOC. Les métadonnées du SIOOC sont conformes aux normes internationales, de sorte que les métadonnées du SIOOC peuvent être exploitées par d’autres plateformes de données, tels que le Dépôt fédéré des données de recherche (DFDR) et le système mondial d’information sur la biodiversité des océans (OBIS).
Rendre les données interopérables signifie que les données sont structurées de manière à pouvoir être combinées avec d’autres jeux de données.
Voici un exemple de l’importance de l’interopérabilité : différents scientifiques travaillant sur la température de l’eau de mer pourraient l’enregistrer comme suit : « Temp. Océan », « Température », « Température de l’eau », « Temp. H2O », etc. Les unités pourraient être enregistrées en utilisant par exemple « C », « degrés C », « Celsius », « Fahrenheit », etc. Pour combiner des données provenant de sources multiples dans cet exemple, il faudrait :
- l’agrégation de variables avec de nombreuses possibilités de température,
- en vérifiant si les unités ont un sens et peuvent être converties,
- puis les convertir.
Pour simplifier le travail des utilisateurs finaux, le SIOOC encourage l’utilisation des normes d’interopérabilité pour toutes les données océaniques. Contactez un spécialiste des données pour discuter de ce que cela signifie pour votre jeu de données.
Le SIOOC vise à utiliser des normes spécifiques à chaque domaine pour chaque type de données.
Pour les observations physiques, le SIOOC utilise les noms normalisés de Climate and Forecast (CF) et les unités canoniques, par exemple, pour «sea_water_temperature», les unités canoniques sont en Kelvin.
Dans le cas où il n’existe pas de nom standard pour une certaine variable, vous pouvez créer un nom personnalisé de votre choix en utilisant le format “variable_names_with_underscores”. Vous pouvez envisager de demander une nouvelle variable CF par l’intermédiaire de leur forum de discussion.
Pour les unités standard, toute unité (par exemple Celsius) convertible dans l’unité canonique peut être utilisée. Les unités spécifiées doivent s’appliquer à toutes les valeurs de cette colonne.
Le climat et les prévisions utilisent le logiciel UDUNITS pour fournir des unités et des définitions, ainsi que des conversions standard entre les types d’unités. Voir la liste actuelle des exigences pour les noms de variables standard de climat et des prévisions. Vous pouvez utiliser les outils de vérification de la conformité qui existent pour ERDDAP™/NetCDF.
Pour les données sur la biodiversité, le SIOOC utilise la norme Darwin Core. Cette norme est également utilisée par d’autres diffuseurs de données tels que le Système d’information sur la biodiversité océanique (OBIS) et le Système mondial d’information sur la biodiversité (GBIF). Principalement basée sur les taxons, les observations, les échantillons et les spécimens, cette normalisation simplifie le processus de publication des jeux de données sur la biodiversité. Elle permet également aux utilisateurs de comparer plus facilement les données interopérables.
Pour les nouvelles variables d’intérêt, veuillez contacter nos spécialistes des données afin de discuter de la dénomination et du formatage appropriés de vos données.
Cela peut dépendre de votre type de données. Veuillez consulter un spécialiste des données du SIOOC si vous avez des questions.
Ceci dit, pour l’intégration des observations physiques dans ERDDAP™, configurez votre tableau de données avec une seule ligne d’en-tête intitulée selon les normes de nomenclature du climat et des prévisions. Chaque variable unique doit avoir sa propre colonne. Les colonnes d’application générale (par exemple, plate-forme, scientifique, date) doivent être situées à gauche des colonnes contenant des observations spécifiques (par exemple, «température de l’eau de mer (degC)»).
Les lignes 2 et suivantes doivent contenir des valeurs provenant d’observations spécifiques. (par exemple, une température de 13,97 °C à une pression de 10 décibars).
Le SIOOC vise à utiliser des normes spécifiques à chaque domaine pour chaque type de données.
Pour les observations physiques, le SIOOC utilise les noms normalisés de Climate and Forecast (CF) et les unités canoniques, par exemple, pour «sea_water_temperature», les unités canoniques sont en Kelvin.
Dans le cas où il n’existe pas de nom standard pour une certaine variable, vous pouvez créer un nom personnalisé de votre choix en utilisant le format “variable_names_with_underscores”. Vous pouvez envisager de demander une nouvelle variable CF par l’intermédiaire de leur forum de discussion.
Pour les unités standard, toute unité (par exemple Celsius) convertible dans l’unité canonique peut être utilisée. Les unités spécifiées doivent s’appliquer à toutes les valeurs de cette colonne.
Le climat et les prévisions utilisent le logiciel UDUNITS pour fournir des unités et des définitions, ainsi que des conversions standard entre les types d’unités. Voir la liste actuelle des exigences pour les noms de variables standard de climat et des prévisions. Vous pouvez utiliser les outils de vérification de la conformité qui existent pour ERDDAP™/NetCDF.
Pour les données sur la biodiversité, le SIOOC utilise la norme Darwin Core. Cette norme est également utilisée par d’autres diffuseurs de données tels que le Système d’information sur la biodiversité océanique (OBIS) et le Système mondial d’information sur la biodiversité (GBIF). Principalement basée sur les taxons, les observations, les échantillons et les spécimens, cette normalisation simplifie le processus de publication des jeux de données sur la biodiversité. Elle permet également aux utilisateurs de comparer plus facilement les données interopérables.
Pour les nouvelles variables d’intérêt, veuillez contacter nos spécialistes des données afin de discuter de la dénomination et du formatage appropriés de vos données.
Si vous n’êtes pas habitué à soumettre des données de biodiversité, lisez attentivement les normes Darwin Core ou contactez-nous, car les normes peuvent varier d’une discipline à l’autre (par exemple, des données d’occurrence ou des données de suivi).
Pour les nouvelles données, nos spécialistes sont heureux de travailler en étroite collaboration avec vous pour s’assurer qu’elles sont correctement formatées pour une intégration facile.
Utiliser les normes ISO 8601 pour les dates :
- AAAA-MM-JJ
- 2022-03-09
Utiliser les normes ISO 8601 pour le temps :
- 2022-03-09T12:00:00-00:00 ou 2022-03-09T12:00:00Z
Enregistrez toujours le fuseau horaire utilisé. L’idéal est d’utiliser l’heure UTC pour faciliter les comparaisons.
Utiliser les degrés décimaux pour la latitude et la longitude.
Par exemple :
OK | dd.dddd -dd.dddd | 57.7997 -51.3327 |
NOT | dd° mm’ ss” -dd° mm’ ss” | 57° 47′ 58.92″ -51° 19′ 57.72″ |
NOT | dd° mm’ ss”N dd° mm’ ss”W | 57° 47′ 58.92″N 51° 19′ 57.72″W |
NOT | dd° mm.mm’ -dd° mm.mm’ | 57° 47.98’ -51° 19.96 |
Le SIOOC ne dispose pas des ressources nécessaires pour rendre toutes les données océaniques du Canada interopérables au nom de la communauté. Cela dit, nos spécialistes des données sont plus qu’heureux de travailler avec vous et votre équipe tout au long du processus de transformation des données pour répondre à vos questions. Nous partageons volontiers notre expérience par rapport à la transformation de gros volumes de données avec les nouveaux contributeurs et nous avons peut-être développé des outils qui peuvent accélérer le processus.
Contactez-nous à l’adresse info@cioos.ca pour que nous puissions vous aider.
Ça dépend de plusieurs facteurs, notamment du nombre de jeux de données, de l’exhaustivité actuelle des métadonnées et de la capacité du fournisseur de données à préparer les données en vue de leur diffusion. Le personnel du SIOOC est présent pour rationaliser ce processus, mais au final, c’est à vous de décider du temps nécessaire. Contactez-nous à l’adresse info@cioos.ca pour obtenir une estimation qui pourrait refléter votre situation.
Les organisations disposant de données correctement formatées et prêtes à être intégrées dans le SIOOC sont priées de contacter un de nos spécialiste des données du à l’adresse info@cioos.ca afin de faciliter l’intégration.
En général, le SIOOC n’est pas une archive de données et ne dispose pas des ressources nécessaires pour héberger tous les jeux de données sur ses serveurs. La plupart des données du SIOOC sont stockées ailleurs et rendues accessibles par l’intermédiaire du SIOOC. N’hésitez pas à nous contacter si vous souhaitez discuter des besoins de votre (vos) jeu(x) de données spécifique(s).
Les fournisseurs de données ont la possibilité de réviser les métadonnées et les données soumises sur les serveurs de développement du SIOOC avant qu’elles ne soient rendues publiques. Les modifications peuvent être apportées et les données seront rendues publiques après l’autorisation.
Nous prenons actuellement en charge les identifiants de métadonnées des chercheurs (Open Researcher and Contributor ID, ORCID) et des institutions (Research Organization Registry, ROR). Les identificateurs d’objets directs (DOI) sont pris en charge par l’Observatoire global du Saint-Laurent (OGSL) et le SIOOC Atlantique.
Vous avez encore des questions ? Envoyez-nous un courriel à info@cioos.ca pour obtenir des réponses concernant votre situation spécifique.
Note
Bien que tout soit mis en œuvre pour contrôler la qualité des données disponibles sur SIOOC, les utilisateurs assument tous les risques et responsabilités liés à l’utilisation directe ou indirecte des données et/ou des informations associées. Si vous avez des inquiétudes concernant un jeu de données disponible à partir du SIOOC, veuillez contacter directement le fournisseur de données.