Intégrité des données

Pour vérifier l’intégrité du flux de données, la plateforme Ortolang génère une somme de contrôle (SHA-1) qui est stockée dans la base de données. Lorsqu’un utilisateur effectue une requête sur le flux de données d’un objet numérique, l’empreinte digitale SHA est utilisée comme clé d’accès pour récupérer le fichier enregistré dans le système de fichiers.
 
La plateforme Ortolang peut seulement lire et écrire le fichier. Elle ne peut pas le modifier. Une somme de contrôle unique est générée pour chaque fichier de données, et le nom du fichier dans le système de fichiers correspond à la somme de contrôle. De cette façon, une seule version du même fichier est réellement enregistrée dans le système de fichiers. Une fois qu’un fichier est stocké sur la plateforme, il devient immuable et toutes les nouvelles versions d’un fichier généreront une empreinte SHA unique.
 
Il existe 3 types d’objets numériques :
  1. un espace de travail, qui contient une collection principale et plusieurs instantanés (collections verrouillées par le processus de publication)
  2. une collection, qui peut avoir des fichiers de métadonnées et contenir des éléments (collection ou objet de données)
  3. un objet de données, qui contient un flux de données (fichier) et des métadonnées.

Les métadonnées sont traitées de la même manière que les données. Les producteurs rédigent les métadonnées et les soumettent ensuite aux modérateurs de la plateforme. Un objet numérique peut contenir une donnée et plusieurs métadonnées. Toutes les modifications apportées à un objet numérique sont enregistrées dans la base de données (événement de table). Et ces événements peuvent être consultés par les producteurs et les administrateurs de la plateforme.

Un espace de travail correspond à un ensemble d’objets numériques. Avant la publication, les objets numériques contenus dans un espace de travail sont disponibles uniquement pour les membres de cet espace. Un membre producteur peut effectuer un grand nombre d’actions (créer, lire, mettre à jour, supprimer). À ce stade, il n’existe aucun contrôle de version. Le producteur peut ensuite décider de publier un instantané de son espace de travail, afin de rendre les données disponibles (avec un contrôle des accès).

Un instantané d’un espace de travail ne peut plus être modifié. Et un espace de travail comprend l’ensemble de ses instantanés.
Le processus de publication génère une nouvelle version pour chaque objet numérique, si des données ou des métadonnées ont été modifiées depuis la dernière version.

Les producteurs doivent s’identifier sur la plateforme en se connectant, avant de pouvoir effectuer un dépôt. Cette étape est obligatoire pour pouvoir téléverser un fichier dans un espace de travail. Seuls les membres d’un espace de travail peuvent y apporter des modifications. L’ensemble des modifications sont répertoriées dans la section « Dernières activités » de chaque espace de travail. Chaque donnée ajoutée à la plateforme possède un propriétaire (répertorié dans la base de données). Et nous pouvons relier chaque événement lié à une donnée, avec la personne qui l’a générée.