Documentidentificator in Document Central
Overzicht
De Documentidentificator in Document Central dient om documenten uniek te identificeren en duplicaten te voorkomen. Deze wordt automatisch gegenereerd wanneer een document wordt geüpload en is gebaseerd op een SHA-512-hash van het Base64-gecodeerde document. Dit mechanisme bepaalt efficiënt of een document al in het systeem bestaat.
Generatie van de Documentidentificator
Bij het uploaden van een document wordt de inhoud omgezet in een Base64-tekenreeks en vervolgens gehasht met behulp van het SHA-512-algoritme om een unieke identificator te creëren. Deze identificator wordt opgeslagen in de tabel Document Entry en biedt de volgende functies:
- Zorgen dat elk document uniek identificeerbaar is.
- Detecteren en voorkomen van dubbele documenten.
- Verbeterde zoek- en ophaalprestaties door documenten te identificeren op basis van hun inhoud.
Gebruik van de Documentidentificator
Preventie van duplicaten
Wanneer een nieuw document wordt geüpload, controleert het systeem of de gegenereerde Documentidentificator al in de Document Entry-tabel bestaat. Indien dat het geval is, krijgt de gebruiker een lijst te zien van alle records waarin het document al voorkomt en kan dan beslissen of hij het alsnog wil uploaden.
Weergave in Document Overviews
De Documentidentificator kan worden weergegeven in Document Overviews. Een speciale actie stelt gebruikers in staat om de hashwaarde van een document te bekijken en te verifiëren.
Documenten zoeken
In de Document Search kunnen documenten specifiek worden gezocht op basis van hun Documentidentificator. Hiervoor moet de uitgebreide weergave worden geopend, waarmee een nauwkeurige filtering op basis van deze identificator mogelijk is. Dit maakt het eenvoudiger om documenten snel te vinden op basis van hun inhoud, zelfs als metadata of bestandsnamen variëren.
Voordelen
- Verhoogde gegevensintegriteit: Zorgt ervoor dat elk document uniek is.
- Geoptimaliseerd opslaggebruik: Het vermijden van onnodige duplicaten vermindert het opslagverbruik.
- Efficiënte zoekfunctionaliteit: Snellere documentopvraging met behulp van de hashwaarde.
- Verbeterde naleving: Biedt een consistente methode om de authenticiteit en uniciteit van documenten te verifiëren.
Door de implementatie van de Documentidentificator biedt Document Central een robuuste oplossing voor het identificeren en beheren van documenten, waardoor zowel de efficiëntie als de gegevenskwaliteit wordt verbeterd.
Beperkingen
De unieke identificatie werkt niet goed met e-mails en hun bijlagen. Wanneer e-mails rechtstreeks worden geüpload vanuit bijvoorbeeld Outlook, verschillen de metadata per e-mail, zelfs als de inhoud hetzelfde is. Bovendien variëren de metadata van de bijlagen telkens wanneer ze worden geëxtraheerd door Document Central. Dit verschil in metadata leidt tot een andere hashwaarde van het document.