Wie liest die KI PDF-Rechnungen aus?
- Mina Smolej

- 14. Okt.
- 3 Min. Lesezeit
Aktualisiert: 7. Nov.
Im Kern unserer Lösung arbeiten intelligente KI-Modelle zusammen, um Ihre PDF-Rechnungen automatisch zu analysieren und in eine klare, maschinenlesbare Form zu überführen. Sie erkennen den Aufbau jeder Rechnung, finden die wichtigsten Informationen, erfassen alles – von den Lieferantendetails bis zu den einzelnen Positionen - und prüfen die Konsistenz der Daten.
Keine Rechnung gleicht der anderen. Die KI muss demnach in der Lage sein, unterschiedliche Layouts, Sprachen, Formate und Strukturen zuverlässig zu verarbeiten. In den folgenden Kapiteln erklären wir, wie unsere KI-Modelle selbst komplexe Rechnungen strukturieren.
Inhaltsverzeichnis
Text erkennen
Ganz am Anfang steht eine PDF-Rechnung. Das Portal erkennt automatisch, ob es sich um eine gescannte Bilddatei oder eine digitale Textdatei handelt. Für jeden Dokumenttyp wird das passende Werkzeug eingesetzt:
OCR für gescannte Dokumente: Wird eine PDF-Rechnung als gescannte Bilddatei hochgeladen, kommt zunächst die optische Zeichenerkennung (OCR) zum Einsatz. Sie wandelt das Bild in lesbaren Text um, sodass auch Rechnungen aus älteren ERP-Systemen oder eingescanntes Papier verarbeitet werden können.
Direkte Textextraktion: Bei digital erzeugten PDF-Rechnungen mit echten Textebenen liest das System den Text direkt aus – ganz ohne OCR. Dadurch bleiben Formatierungen erhalten und die Genauigkeit steigt.
Eine wichtige Innovation sind unsere Quellenangaben. Die Software merkt sich genau, wo jede Information im Originaldokument steht. Wenn die KI zum Beispiel „Gesamt: 1.248,50 €“ erkennt, speichert sie auch die exakte Position im PDF. So lässt sich später leicht überprüfen, ob die ausgelesenen Daten mit dem Original übereinstimmen – das ist besonders wichtig für Kontrolle, Rückfragen oder Qualitätssicherung.
Rechnung auslesen
Sobald wir maschinenlesbaren Text und Quellenangaben haben, beginnt die eigentliche Intelligenz. Im nächsten Schritt ruft die KI mehrere spezialisierte Modell auf, die jeweils bestimmte Teile der Rechnung auswerten:
Dokumentenklassifikation: Ein erstes, schnelles Modell erkennt den Dokumententyp, die Struktur und den Komplexitätsgrad. Handelt es sich um eine einfache einseitige Rechnung oder um ein komplexes mehrseitiges Dokument mit zusätzlichen Anhängen? Diese Klassifikation bestimmt die weitere Verarbeitung.
Strukturierte Datenerfassung: Spezialisierte Modelle extrahieren verschiedene Datensätze parallel. Ein Modell nimmt sich die Kopfzeile vor, während ein weiteres die Positionen auswertet. Diese parallele Verarbeitung erhöht sowohl Geschwindigkeit als auch Genauigkeit, da jedes Modell sich spezialisieren kann.
Bei komplexen Rechnungen prüft ein weiteres Modell die innere Logik der Daten. Mehr dazu im nächsten Kapitel.
Logik prüfen
Herkömmliche, auf Schnelligkeit optimierte Modelle eignen sich gut für einfache Rechnungen mit Standardlayout. Bei komplexeren Szenarien stoßen sie jedoch oft an ihre Grenzen:
mehrseitige Dokumente
verschachtelte Tabellen
gestaffelte Rabatte
über das Dokument verteilte Gebühren
komplexe Steuerberechnungen mit unterschiedlichen Sätzen
Um auch diese Szenarien zuverlässig zu verarbeiten, setzen wir leistungsfähigere Reasoning-Modelle ein. Diese prüfen nicht nur, ob die Daten korrekt ausgelesen wurden, sondern „denken mit“: Sie gleichen Positionen, Rabatte, Zuschläge und Steuern ab, prüfen Summen und stellen sicher, dass alles den geltenden Regeln entspricht. Dabei validieren sie unter anderem:
Stimmt die Menge × Einzelpreis mit den angegebenen Zwischensummen überein?
Werden Rabatte vor oder nach bestimmten Gebühren angewendet?
Sind Versand-, Bearbeitungs- oder Sondergebühren korrekt erfasst?
Stimmen Steuersätze und Berechnungen mit den geltenden Regeln überein?
Dank dieser umfassenden Validierung führt die KI bereits Dutzende Konsistenzprüfungen durch, bevor eine Rechnung Ihre Prüfschleife erreicht. Selbst bei einer komplexen 5-seitigen Rechnung mit über 50 Positionen, mehreren Rabattstufen und Versandkosten sorgt die zusätzliche Verarbeitungszeit von 10–30 Sekunden für deutlich höhere Genauigkeit – und Sie müssen weniger manuell korrigieren.

Variationen verstehen
Trotz ihrer Leistungsfähigkeit arbeiten unsere KI-Modelle nicht immer exakt gleich. Das heißt: Dieselbe Rechnung kann bei verschiedenen Durchläufen manchmal leicht unterschiedliche Ergebnisse liefern.
Der Grund liegt in der Arbeitsweise der KI: Sie denkt nicht starr nach, sondern wählt bei jedem Durchlauf aus mehreren Möglichkeiten die wahrscheinlichste Lösung. Daher können Ergebnisse leicht variieren.
Für unsere Kunden bedeutet das: Die meisten Rechnungen werden zuverlässig und korrekt verarbeitet. Bei einzelnen Rechnungen können jedoch kleine Unterschiede auftreten – zum Beispiel bei der Schreibweise eines Lieferantennamens oder bei der Darstellung von Positionsbeschreibungen.
Fazit
Wir entwickeln und trainieren unsere KI-Modelle ständig weiter, um die Verarbeitung Ihrer Rechnungen noch zuverlässiger zu machen. Immer wieder erscheinen neue, fortschrittlichere KI-Generationen. Wir testen sie und prüfen, ob sie unsere Rechnungsverarbeitung verbessern können.
Gleichzeitig analysieren wir unsere eigene Rechnungsdatenbank, um wiederkehrende Fehler aufzuspüren. Treten bestimmte Probleme häufiger auf, passen wir unsere Modelle gezielt an. Damit arbeitet die KI immer zuverlässiger.


