Aller au contenu

Identifiant de Document dans Document Central

Vue d'ensemble

L'Identifiant de Document dans Document Central sert à identifier de manière unique les documents et à éviter les doublons. Il est généré automatiquement lors du téléversement d'un document et est basé sur un hachage SHA-512 du document encodé en Base64. Ce mécanisme permet de déterminer efficacement si un document existe déjà dans le système.

Génération de l'Identifiant de Document

Lors du téléversement d'un document, son contenu est converti en une chaîne Base64, puis haché à l'aide de l'algorithme SHA-512 pour créer un identifiant unique. Cet identifiant est stocké dans la table Document Entry et permet les fonctions suivantes :

  • Assurer que chaque document soit identifié de manière unique.
  • Détecter et éviter les documents en double.
  • Améliorer les performances de recherche et de récupération en permettant l'identification des documents en fonction de leur contenu.

Utilisation de l'Identifiant de Document

Prévention des Doublons

Lors du téléversement d'un nouveau document, le système vérifie si l'Identifiant de Document généré existe déjà dans la table Document Entry. Si c'est le cas, l'utilisateur reçoit une liste de tous les enregistrements où le document est déjà présent et peut décider de le téléverser malgré tout.

Affichage dans Document Overviews

L'Identifiant de Document peut être affiché dans Document Overviews. Une action spécifique permet aux utilisateurs de voir et de vérifier la valeur de hachage d'un document.

Recherche de Documents

Dans la Document Search, les documents peuvent être recherchés spécifiquement en utilisant leur Identifiant de Document. Pour cela, il faut ouvrir la vue avancée, qui permet un filtrage précis basé sur cet identifiant. Cela facilite la recherche rapide de documents en fonction de leur contenu, même si les métadonnées ou les noms de fichiers varient.

Avantages

  • Intégrité des Données Améliorée : Garantit l'unicité de chaque document.
  • Utilisation Optimisée du Stockage : La suppression des doublons réduit la consommation d'espace.
  • Fonctionnalité de Recherche Efficace : Récupération plus rapide des documents via la valeur de hachage.
  • Conformité Renforcée : Fournit un moyen cohérent de vérifier l'authenticité et l'unicité des documents.

Avec l'implémentation de l'Identifiant de Document, Document Central offre une solution robuste pour l'identification et la gestion des documents, améliorant à la fois l'efficacité et la qualité des données.

Restrictions

L’identifiant unique ne fonctionnera pas correctement avec les e-mails et leurs pièces jointes. Lorsque les e-mails sont téléchargés directement depuis, par exemple, Outlook, les métadonnées diffèrent pour chaque e-mail, même si le contenu est identique. De plus, les métadonnées des pièces jointes varieront à chaque extraction par Document Central. Cette différence de métadonnées entraînera une valeur de hachage différente pour le document.

See also