Einrichtung von Erfassungs-Konfigurationen
Zuletzt aktualisiert: 03.09.2025 • Lesezeit: ~7 Minuten
Erfassungs-Konfigurationen sind ein zentrales Element von Smart Processing. Sie definieren wie Dokumente analysiert und welche Daten aus ihnen extrahiert werden. Die extrahierten Daten bilden die Grundlage für konsistente, konforme und sichere Prozesse.
Es stehen zwei Methoden zur Verfügung, um Dokumente zu analysieren und Daten zu extrahieren:
- Content Understanding Erfassungsmethode
- Document Intelligence Erfassungsmethode
Hinweis
Stellen Sie sicher, dass die erforderlichen KI-Dienste eingerichtet sind.
- Content Understanding erfordert den Content Understanding Service.
- Document Intelligence erfordert den Document Intelligence Service.
Wichtig
Erfassungs-Konfigurationen sind nur für Standarddokumente vorgesehen. Es sind keine individuellen Erfassungs-Konfigurationen für XML- oder E-Mail-Dokumente verfügbar, da diese automatisch über vordefinierte Szenarien verarbeitet werden.
Erstellen einer Erfassungs-Konfiguration
Befolgen Sie diese Schritte, um eine neue Erfassungs-Konfiguration zu erstellen:
- Beginnen Sie im Bereich Smart Processing Setup.
- Wählen Sie im Menü Setups den Eintrag Erfassungs-Konfiguration aus.
- Klicken Sie auf Erstellen, um eine neue Konfiguration einzurichten.
- Folgen Sie dem Assistenten, um die Methode auszuwählen, Felder zu definieren und Validierungsregeln festzulegen.
Übersicht der Methoden
Content Understanding (CU) Erfassungsmethode
Mit der CU-Methode definieren Sie welche Daten aus einem Dokument basierend auf klaren Feldbeschreibungen extrahiert werden sollen.
- Besonders geeignet für variierende oder komplexe Dokumentstrukturen.
- Felder werden inhaltlich (semantisch) erkannt, unabhängig vom Layout.
- Ideal, wenn der Fokus auf Inhalt statt Layout liegt.
Document Intelligence (DI) Erfassungsmethode
Die DI-Methode analysiert Dokumente basierend auf dem Layout.
- Verwendet vortrainierte Modelle für typische Dokumenttypen – ermöglicht einen schnellen Start.
- Optional können benutzerdefinierte Modelle trainiert werden, um individuelle oder komplexe Layouts zuverlässig zu verarbeiten.
- Geeignet, wenn das Layout stabil ist oder besonders hohe Genauigkeit erforderlich ist.
Welche Methode wann?
| Szenario | Empfehlung | Begründung |
|---|---|---|
| Viele verschiedene Layouts, Fokus auf Inhalt | Content Understanding | Semantische Extraktion, robust gegenüber Layoutvariationen |
| Standardisierte Dokumente mit stabiler Struktur | Document Intelligence (vorinstalliert) | Schnell einzurichten, geringer Konfigurationsaufwand |
| Sehr spezifische oder komplexe Layouts, hohe Präzision erforderlich | Document Intelligence (benutzerdefiniertes Modell) | Maximale Stabilität durch Training, aber höherer Aufwand |
| Schnelles Prototyping oder kurze Iterationszyklen | Content Understanding | Felder können einfach beschrieben und direkt getestet werden |
Empfehlung
Beginnen Sie mit Content Understanding, wenn Sie viele Layoutvariationen erwarten oder wenn der Inhalt Priorität hat. Verwenden Sie Document Intelligence (vorinstalliert) für einen schnellen Start. Verwenden Sie benutzerdefinierte Modelle nur, wenn CU oder vorinstallierte DI keine ausreichend genauen Ergebnisse liefern.
Wie erstelle ich einen Content Understanding Analyzer?
Wenn Sie die Content Understanding (CU) Methode gewählt haben, können Sie direkt einen neuen Analyzer in Business Central erstellen und verwalten. Eine spezielle Konfigurationsseite steht dafür zur Verfügung.
Sie können diese Seite entweder öffnen:
- in der jeweiligen Erfassungs-Konfiguration über die Aktion AI Content Understanding Setup, oder
- direkt über die Seite Smart Processing Setup.
In dieser Übersicht können Sie alle bereits vorhandenen Analyzer im Dienst sehen. Jeder Analyzer wird dort gespeichert und bei Änderungen automatisch synchronisiert.
Um einen neuen Analyzer zu erstellen, befolgen Sie diese Schritte:
- Klicken Sie auf Neu, um einen Analyzer zu erstellen.
- Weisen Sie dem Analyzer einen eindeutigen Namen zu.
- Definieren Sie, welche Felder auf den Header- und Zeilen-Ebenen extrahiert werden sollen.
Für jedes Feld sind die folgenden Informationen verfügbar:
| Einstellung | Beschreibung |
|---|---|
| Feldname | Technischer Name des zu extrahierenden Feldes. Oft reicht der Name allein aus, aber eine detaillierte Beschreibung wird für bessere Ergebnisse empfohlen. |
| Feldbeschreibung | Freitextbeschreibung, die den Kontext des Feldes erklärt. Formulieren Sie es so, als würden Sie einer Person erklären, wo und wie sie das Feld finden kann. |
| Werttyp | Erwarteter Datentyp des Feldes. Verfügbare Optionen: String, Date, Number, Integer. |
Analyzer-Aktionen
| Aktion | Zweck |
|---|---|
| Schema Management → Import Process Template | Importiert Felder direkt aus einer bestehenden Prozessvorlage. Vorteil: Die Feldnamen sind identisch mit der Vorlage, was sicherstellt, dass die Zuordnung später 100% genau ist. Es wird auch garantiert, dass alle relevanten Felder im Analyzer erfasst werden. |
| Test Analyze Tool | Wird während der Einrichtung zum Testen verwendet. 1. Laden Sie ein Testdokument hoch. 2. Führen Sie die Aktion Run Test Analyze Tool aus. 3. Ein temporärer Analyzer wird erstellt, und eine Erfassungssimulation wird gestartet. 4. Die Ergebnisse werden in einer Vorschau angezeigt. |
| Analyzer erstellen | Erstellt das endgültige Modell. Nur erstellte Analyzer können in der Produktion verwendet werden. |
Analyzer bearbeiten
Sie haben auch die Möglichkeit, bestehende Analyzer zu erweitern oder anzupassen. Geben Sie einfach einen Analyzer ein und bearbeiten Sie ihn wie gewohnt. Sie können den Analyzer dann erneut testen und neu erstellen.
Hinweise zum Erstellungsprozess:
- Das Erstellen (Build) dauert in der Regel nur wenige Sekunden.
- Sie können den aktuellen Status über die Aktion Liste aktualisieren einsehen.
- Bereits erstellte Analyzer sind sofort für die Felderfassung verfügbar.
Best Practice
Verwenden Sie immer zuerst Import Process Template, bevor Sie Felder manuell definieren. Dies stellt sicher, dass die Feldnamen genau mit der Vorlage übereinstimmen und dass die Zuordnung später einwandfrei funktioniert.
Benutzerdefiniertes OCR-Template konfigurieren
Unsere Erfassungsmethode ist KI-gestützt und äußerst genau. Sie kann den Kontext verstehen und Werte präzise aus Dokumenten extrahieren. Allerdings ist KI nicht perfekt – einige Fälle können nicht zuverlässig nur durch Eingabeaufforderungen gelöst werden, insbesondere stark unstrukturierte Layouts oder Dokumente von bestimmten Kunden.
Um diese Fälle zu adressieren, bieten wir ein hybrides System an. Die KI-Extraktion läuft immer als erste Schicht. Danach kann eine optionale zweite Schicht manuelle OCR-Positionen anwenden, die für einzelne Kunden definiert sind, um spezifische Felder mit hoher Präzision zu extrahieren. Dies ermöglicht es den Kunden, die Extraktion für spezifische Layouts zu optimieren und genaue Positionen für höhere Genauigkeit festzulegen.
Um benutzerdefinierte Vorlagen zu verwenden, muss Ihre Prozessvorlage ein Feld enthalten, das mit *Name endet. Dies dient als Zuordnungsschlüssel, der eingehende Dokumente mit ihrer entsprechenden benutzerdefinierten Vorlage verknüpft.
Erstellen einer benutzerdefinierten Vorlage
- Laden Sie das Dokument wie gewohnt hoch, klassifizieren und verarbeiten Sie es.
- Überprüfen Sie im Entwurf, ob Daten falsch oder unvollständig extrahiert wurden.
- Verwenden Sie die Aktion „Extrahierte Daten anzeigen“, um die detaillierte Extraktionsansicht zu öffnen.
- Klicken Sie oben rechts auf Bearbeiten, um in den Bearbeitungsmodus zu wechseln.
Felder neu zuordnen oder hinzufügen
Im Bearbeitungsmodus können Felder neu zugeordnet oder neue Felder aus der Vorlage zugeordnet werden:
- Wählen Sie ein Feld aus und klicken Sie auf Bearbeiten
- Markieren Sie die entsprechende Position im Dokument mit der Maus
- Nach dem Loslassen wird der Wert extrahiert und angezeigt
- Wiederholen Sie dies für so viele Felder, wie benötigt
Für Artikel-Tabellen wird jede Zeile automatisch verarbeitet. Beim Markieren eines Bereichs durchläuft das System alle Zeilen und extrahiert die Werte entsprechend.
Speichern & Anwenden
Sobald Sie zufrieden sind, speichern Sie Ihre Änderungen. Eine Vorlage wird für den jeweiligen Zuordnungsschlüssel (z. B. Kunde) erstellt. Wenn neue Dokumente mit derselben Klassifizierung und demselben Kunden eintreffen, wird die benutzerdefinierte Vorlage automatisch angewendet.
Hinweis: Wenn Sie den Kunden im Entwurf ändern, wird der Entwurf neu generiert, da sich die Extraktion aufgrund der zugehörigen benutzerdefinierten Vorlage ändern kann.
Häufig gestellte Fragen
Brauche ich unbedingt beide Methoden? Nein. Viele Szenarien können vollständig mit einer Methode umgesetzt werden. Gemischte Szenarien, z. B. DI für Standardrechnungen und CU für spezielle Formate, sind möglich.
Was passiert, wenn kein Dienst eingerichtet ist oder die Anmeldeinformationen ungültig sind? Beim Starten einer Aktion wird eine Fehlermeldung angezeigt, die beschreibt, welcher Dienst fehlt oder welche Einstellungen überprüft werden müssen.
Zusammenfassung
- Erfassungs-Konfigurationen steuern, wie Daten aus Dokumenten extrahiert werden.
- Content Understanding ist flexibel, semantisch und ideal für variierende Layouts.
- Document Intelligence ist layoutorientiert, schnell mit vorinstallierten Modellen und besonders robust mit benutzerdefinierten Modellen.
- Wählen Sie die Methode basierend auf Layoutvielfalt, Einrichtungsaufwand und spezifischem Anwendungsfall.