Aller au contenu

Configuration des Captures

Dernière mise à jour : 03.09.2025 • Temps de lecture : ~7 minutes

Les Configurations de Capture sont un élément central du Traitement Intelligent. Elles définissent comment les documents sont analysés et quelles données en sont extraites. Les données extraites forment la base de processus cohérents, conformes et sécurisés.

Il existe deux méthodes disponibles pour analyser les documents et extraire des données :

  • Méthode de Capture de Compréhension du Contenu
  • Méthode de Capture d'Intelligence Documentaire

Remarque

Assurez-vous que les Services IA requis sont configurés.

  • Compréhension du Contenu nécessite le Service de Compréhension du Contenu.
  • Intelligence Documentaire nécessite le Service d'Intelligence Documentaire.

Important

Les Configurations de Capture sont destinées uniquement aux documents standards. Aucune Configuration de Capture individuelle n'est disponible pour les documents XML ou par e-mail, car ceux-ci sont traités automatiquement via des scénarios prédéfinis.


Création d'une Configuration de Capture

Suivez ces étapes pour créer une nouvelle Configuration de Capture :

  1. Commencez dans la zone Configuration du Traitement Intelligent.
  2. Dans le menu Configurations, sélectionnez l'entrée Configuration de Capture.
  3. Cliquez sur Créer pour configurer une nouvelle configuration.
  4. Suivez l'Assistant pour sélectionner la méthode, définir les champs et établir les règles de validation.

Aperçu des Méthodes

Méthode de Capture de Compréhension du Contenu (CU)

Avec la méthode CU, vous définissez quelles données doivent être extraites d'un document en fonction de descriptions de champs claires.

  • Particulièrement adaptée aux structures de documents variées ou complexes.
  • Les champs sont reconnus sémantiquement, indépendamment de la mise en page.
  • Idéal lorsque l'accent est mis sur le contenu plutôt que sur la mise en page.

Méthode de Capture d'Intelligence Documentaire (DI)

La méthode DI analyse les documents en fonction de la mise en page.

  • Utilise des modèles pré-entraînés pour des types de documents typiques – permet un démarrage rapide.
  • En option, des modèles personnalisés peuvent être entraînés pour traiter de manière fiable des mises en page individuelles ou complexes.
  • Convient lorsque la mise en page est stable ou qu'une haute précision est requise.

Quelle Méthode Quand ?

Scénario Recommandation Justification
De nombreuses mises en page différentes, accent sur le contenu Compréhension du Contenu Extraction sémantique, robuste face aux variations de mise en page
Documents standardisés avec une structure stable Intelligence Documentaire (préconstruite) Rapide à configurer, faible effort de configuration
Mises en page très spécifiques ou complexes, haute précision requise Intelligence Documentaire (Modèle Personnalisé) Stabilité maximale grâce à l'entraînement, mais effort plus élevé
Prototypage rapide ou cycles d'itération courts Compréhension du Contenu Les champs peuvent être facilement décrits et testés directement

Recommandation

Commencez par Compréhension du Contenu si vous vous attendez à de nombreuses variations de mise en page ou si le contenu est la priorité. Utilisez Intelligence Documentaire (préconstruite) pour un démarrage rapide. N'utilisez Modèles Personnalisés que si CU ou DI préconstruée ne fournissent pas des résultats suffisamment précis.


Comment Créer un Analyseur de Compréhension du Contenu ?

Si vous avez choisi la méthode Compréhension du Contenu (CU), vous pouvez directement créer et gérer un nouvel analyseur dans Business Central. Une page de configuration dédiée est disponible à cet effet.

Vous pouvez ouvrir cette page soit :

  • dans la Configuration de Capture respective via l'action Configuration de Compréhension du Contenu IA, ou
  • directement à partir de la page Configuration du Traitement Intelligent.

Dans cet aperçu, vous pouvez voir tous les analyseurs qui existent déjà dans le service. Chaque analyseur y est stocké et synchronisé automatiquement lors des modifications.

Pour créer un nouvel analyseur, suivez ces étapes :

  1. Cliquez sur Nouveau pour créer un analyseur.
  2. Attribuez un nom unique à l'analyseur.
  3. Définissez quels champs doivent être extraits aux niveaux En-tête et Ligne.

Pour chaque champ, les informations suivantes sont disponibles :

Paramètre Description
Nom du Champ Nom technique du champ à extraire. Souvent, le nom seul est suffisant, mais une description détaillée est recommandée pour de meilleurs résultats.
Description du Champ Description en texte libre qui explique le contexte du champ. Formulez-le comme si vous expliquiez à une personne où et comment trouver le champ.
Type de Valeur Type de données attendu du champ. Options disponibles : String, Date, Number, Integer.

Actions de l'Analyseur

Action But
Gestion du Schéma → Importer le Modèle de Processus Importe les champs directement à partir d'un Modèle de Processus existant. Avantage : Les noms des champs sont identiques à ceux du modèle, garantissant que la correspondance est 100 % précise par la suite. Cela garantit également que tous les champs pertinents sont capturés dans l'analyseur.
Outil d'Analyse de Test Utilisé pour les tests lors de la configuration.
1. Téléchargez un document de test.
2. Exécutez l'action Exécuter l'Outil d'Analyse de Test.
3. Un analyseur temporaire est créé, et une simulation de capture est lancée.
4. Les résultats sont affichés dans un Aperçu.
Construire l'Analyseur Crée le modèle final. Seuls les analyseurs construits peuvent être utilisés en production.

Édition de l'Analyseur

Vous avez également la possibilité d'étendre ou d'ajuster des analyseurs existants. Il vous suffit d'entrer dans un analyseur et de l'éditer comme d'habitude. Vous pouvez ensuite tester à nouveau l'analyseur et le reconstruire.

Remarques sur le Processus de Construction :

  • La construction (Build) prend généralement seulement quelques secondes.
  • Vous pouvez voir l'état actuel via l'action Actualiser la Liste.
  • Les analyseurs déjà construits sont immédiatement disponibles pour l'extraction de champs.

Meilleure Pratique

Utilisez toujours Importer le Modèle de Processus en premier avant de définir manuellement des champs. Cela garantit que les noms des champs correspondent exactement au modèle et que la correspondance fonctionne sans faille par la suite.


Configurer un Modèle OCR Personnalisé

Notre méthode de capture est alimentée par l'IA et extrêmement précise. Elle peut comprendre le contexte et extraire des valeurs précisément à partir des documents. Cependant, l'IA n'est pas parfaite — certains cas ne peuvent pas être résolus de manière fiable uniquement par des invites, en particulier les mises en page très non structurées ou les documents de clients spécifiques.

Pour traiter ces cas, nous offrons un système hybride. L'extraction par IA fonctionne toujours comme première couche. Après cela, une seconde couche optionnelle peut appliquer des positions OCR manuelles définies pour des clients individuels afin d'extraire des champs spécifiques avec une grande précision. Cela permet aux clients d'affiner l'extraction pour des mises en page spécifiques et de définir des positions exactes pour une précision accrue.

Pour utiliser des modèles personnalisés, votre modèle de processus doit contenir un champ se terminant par *Name. Cela sert de clé de mappage qui relie les documents entrants à leur modèle personnalisé correspondant.

Création d'un Modèle Personnalisé

  1. Téléchargez, classifiez et traitez le document comme d'habitude.
  2. Dans la fenêtre de Brouillon, vérifiez si des données ont été extraites de manière incorrecte ou incomplète.
  3. Utilisez l'action “Afficher les données extraites” pour ouvrir la vue d'extraction détaillée.
  4. Cliquez sur Modifier dans le coin supérieur droit pour entrer en mode d'édition.

Re-mappage ou ajout de champs

En mode d'édition, les champs peuvent être re-mappés ou de nouveaux champs du modèle peuvent être mappés :

  • Sélectionnez un champ et cliquez sur Modifier
  • Marquez la position correspondante dans le document à l'aide de la souris
  • Une fois relâché, la valeur est extraite et affichée
  • Répétez pour autant de champs que nécessaire

Pour les tableaux d'articles, chaque ligne est automatiquement traitée. Lors de la marquage d'une zone, le système itère à travers toutes les lignes et extrait les valeurs en conséquence.

Enregistrer & Appliquer

Une fois que vous êtes satisfait, enregistrez vos modifications. Un modèle sera créé pour la clé de mappage respective (par exemple, Client). Lorsque de nouveaux documents avec la même classification et le même Client arrivent, le modèle personnalisé sera automatiquement appliqué.

Remarque : Si vous changez le Client dans le Brouillon, le Brouillon sera régénéré car l'extraction peut changer en raison du modèle personnalisé associé.


Questions Fréquemment Posées

Ai-je nécessairement besoin des deux méthodes ? Non. De nombreux scénarios peuvent être entièrement mis en œuvre avec une seule méthode. Des scénarios mixtes, par exemple, DI pour des factures standard et CU pour des formats spéciaux, sont possibles.

Que se passe-t-il si aucun service n'est configuré ou si les identifiants sont invalides ? Lors du démarrage d'une action, un message d'erreur sera affiché, décrivant quel service est manquant ou quels paramètres doivent être vérifiés.


Résumé

  • Les Configurations de Capture contrôlent comment les données sont extraites des documents.
  • La Compréhension du Contenu est flexible, sémantique et idéale pour des mises en page variées.
  • L'Intelligence Documentaire est orientée vers la mise en page, rapide avec des modèles préconstruits, et particulièrement robuste avec des modèles personnalisés.
  • Choisissez la méthode en fonction de la variété de mise en page, de l'effort de configuration et du cas d'utilisation spécifique.

Prochaines Étapes