Künstliche Intelligenz hilft uns beim Auslesen und Verarbeiten von unstrukturierten Daten, wie beispielsweise Adressdaten aus PDF-Dokumenten. Dabei kombinieren wir das Beste aus regelbasierter und KI-gestützter Extraktion.
- Regelbasierte Extraktion: Es werden vordefinierte Muster und Regeln genutzt, um relevante Daten aus digitalen Dokumenten (wie Rechnungen oder Bestellungen) zu identifizieren, z. B. Rechnungsnummer, Bestelldatum oder Beträge. Diese Regeln basieren auf dynamischen Strukturen, Schlüsselwörtern, Stoppwörtern oder Mustern wie regulären Ausdrücken (RegEx). Diese Methodik ist zuverlässig und seit vielen Jahren bewährt, wenn die Dokumente allgemeingültigen Strukturen und Formaten folgen. Bei stark variierenden Layouts und einer großen Varianz in den Sprachen des Dokuments setzt die KI-gestützte Extraktion an.
- KI-gestützte Extraktion: Mithilfe von modernen und von uns weiterentwickelten KI-Modellen erkennt und extrahiert die Künstliche Intelligenz auch Belegdaten, bei denen die regelbasierte Extraktion an ihre Grenzen stößt – wie aktuell z. B. Auftraggeber-, Liefer- und Rechnungsadressen bei eingehenden Bestellungen in unterschiedlichsten Sprachen.
Die aus dem Dokument ausgelesenen Metadaten gleichen wir anschließend mit Informationen aus dem angebundenen ERP-System ab. Abweichungen oder Tippfehler werden automatisch erkannt und korrigiert. Die dadurch verifizierten Adress- und Produktinformationen übernehmen wir vollständig in SAP und sorgen beispielsweise für ein automatisiertes Verknüpfen von Adressdaten mit den zugehörigen SAP-Accounts.