Cookie-Einstellungen

Diese Website setzt zustimmungspflichtige Cookies ein. Details

TECHNOLOGY STRATEGY

Automation and Data Extraction

Die Extraktion von Informationen aus Dokumenten ist vielleicht nicht die aufregendste Anwendung der Automatisierung, aber sie birgt ein enormes Potenzial zur Reduzierung von Fehlern und Kosten.

Nikola Schmidt

August 01,2022

Die Extraktion von Informationen aus Dokumenten ist vielleicht nicht die aufregendste Anwendung der Automatisierung, aber sie birgt ein enormes Potenzial zur Reduzierung von Fehlern und Kosten.

Die Bearbeitung von Rechnungen ist ein grundlegender und wichtiger Bestandteil des Geschäftsbetriebs. Aber es ist ein hartes Stück Arbeit. Jeder Lieferant hat seine eigenen Macken, jede Rechnung ihre eigene Nomenklatur - bei einem Unternehmen heißt es "Zahlungsziel 15 Tage", bei einem anderen "Zahlung in zwei Wochen". Selbst wenn die Rechnungen jeden Monat vom selben Lieferanten kommen, wechseln die Beschaffungsbeauftragten, die Formate variieren, und es schleichen sich Tippfehler ein. Und natürlich sind die Rechnungen nur die Spitze des Dokumentations-Eisbergs. Jeden Tag, in jedem Unternehmen, auf jeder Verwaltungs- und Betriebsebene, müssen die Mitarbeiter Details aus Verträgen, Mietverträgen, Steuerformularen, Umfragen und anderen Dokumenten extrahieren.

Die gute Nachricht? Künstliche Intelligenz (KI) bietet Möglichkeiten, diese komplexen, integrierten Aufgaben weitaus effizienter zu erledigen. Diese Lösungen sind nahtlos und skalierbar, einfach zu bedienen und leicht zu verwalten. Durch den Einsatz verschiedener innovativer KI-Techniken können Unternehmen Dokumente schneller verarbeiten und Betriebsabläufe vereinfachen; weniger Fehler bedeuten weniger Korrekturen und Rücknahmen. Jüngste Untersuchungen von PwC zur Automatisierung von Analysen haben ergeben, dass selbst die rudimentärsten KI-basierten Extraktionstechniken Unternehmen 30-40 % der Stunden einsparen können, die normalerweise für solche Prozesse aufgewendet werden.

Wir alle kennen den paradigmenverändernden Einsatz von KI für Netflix-Empfehlungen, Chatbots, die sich online als Kundendienstmitarbeiter ausgeben, die dynamische Preisgestaltung für Hotelzimmer und die Erstellung von Routen für Lieferunternehmen. Diese Bemühungen sind die Wertschöpfungsmotoren unzähliger großer, erfolgreicher Unternehmen. Wir sprechen hier von einem deutlich weniger aufsehenerregenden und auf den ersten Blick eher langweiligen Einsatz von KI, der auf die Senkung von Kosten und die Optimierung von Abläufen abzielt, anstatt Branchen zu verändern oder neu zu schaffen. Aber diese langweilige KI ist eigentlich ziemlich aufregend, weil sie sich mit Problemen auseinandersetzt, mit denen alle Unternehmen zu kämpfen haben, und weil die Produktivitätsgewinne (und damit die Gewinnspannen und Bewertungen) real sind.

Doch trotz des enormen Potenzials haben laut der PwC-Studie "AI Predictions 2021" nur 28 % der Führungskräfte dem Einsatz von KI und maschinellem Lernen zur Informationsgewinnung Priorität eingeräumt, deutlich weniger als bei anderen Anwendungen wie Chatbots und Lösungen für die Sicherheit am Arbeitsplatz. Einige Führungskräfte sind wahrscheinlich mit dem Zeit- und Ressourcenaufwand für die Entwicklung, Skalierung und Integration dieser fortschrittlichen Technologien überfordert. Einige werden zögern, der KI zu vertrauen, oder sind skeptisch, was ihren Nutzen angeht. Andere übersehen vielleicht einfach den Wert der automatischen Informationsextraktion, weil es sich um eine Back-Office-Funktion handelt. Aus welchem Grund auch immer, sie verpassen eine Gelegenheit, Prozesse zu rationalisieren und ihre Kapitalrendite zu verbessern.

28 % der Führungskräfte haben den Einsatz von KI und maschinellem Lernen für die Informationsgewinnung zur Priorität erklärt.

Das Problem des Papierkrams

Jedes Unternehmen, das die Bücher eines Kunden prüft, verbringt jedes Jahr eine enorme Anzahl von Stunden mit dem Sammeln von Belegen und der Überprüfung von Transaktionen, um zu bestätigen, dass die Bilanzen und Transaktionen im Zusammenhang mit den Jahresabschlüssen des Kunden korrekt sind; dies wird als "Prüfung der Details" bezeichnet. Fast drei Jahrzehnte lang haben die Mitarbeiter Tabellenkalkulationen (zunächst Lotus 1-2-3, dann Microsoft Excel) als wichtigstes Hilfsmittel für die Prüfung der Einzelheiten verwendet.

Heute liegen die Belege für diese Prüfungen in der Regel in PDF-Form vor - Rechnungen, Kontoauszüge, Quittungen - und können mehrere tausend Seiten umfassen. Die in diesen PDFs enthaltenen Informationen müssen manuell in die Tabellenkalkulation eingegeben werden. Bei einem mittelständischen Unternehmen, das jährlich 100.000 Seiten an Dokumenten verarbeitet, würde dies bei einem Zeitaufwand von drei Minuten pro Seite etwa 5.000 Personenstunden in Anspruch nehmen; bei 50 US-Dollar pro Stunde sind das 250.000 US-Dollar.

Was wäre nun, wenn dasselbe Unternehmen erweiterte Intelligenz einsetzen könnte? Dies ist der Begriff für Anwendungen, die auf adaptiven Systemen basieren, die durch maschinelles Lernen angetrieben werden und bei denen die Algorithmen aus der menschlichen Erfahrung lernen, die endgültige Entscheidung aber von Menschen getroffen wird. Das KI-Tool kann den Text auf den einzelnen Rechnungen "lesen" und mithilfe der relationalen Datensuche schnell Belegdokumente identifizieren, die das Unternehmen zuvor als wichtig gekennzeichnet hat - eine leistungsstarke Abkürzung bei der Verwaltung von Millionen von Rechnungsausnahmen. Auch wenn Papierrechnungen für jeden Lieferanten einzigartig sein können, können KI-Techniken wichtige Felder in den verschiedenen Rechnungen, wie z. B. Stückkosten und Menge, identifizieren und die Hauptbuchsalden automatisch berechnen. Durch die Implementierung einer KI-Lösung und unter der Annahme der obigen 40 %-Schätzung könnte das Beispiel-Mittelstandsunternehmen 2.000 Stunden pro 100.000 verarbeitete Seiten einsparen.

40 % weniger Stunden werden für die Bearbeitung von Routine-Papieren benötigt, wenn selbst die rudimentärsten KI-basierten Extraktionstechniken eingesetzt werden.

Ein weiteres Problem, mit dem sich viele Unternehmen auseinandersetzen müssen, ist die Auslegung und Beantwortung von Steuerbescheiden oder -briefen, die von staatlichen Finanzbehörden an Privatpersonen und Unternehmen verschickt werden. In den USA gibt es auf Bundesebene mehr als 100 solcher Steuerbescheide und in den einzelnen Bundesstaaten Tausende mehr: Kontoänderungen, Zahlungsaufforderungen, Unstimmigkeiten in der Steuererklärung. In jedem Fall muss jemand das Schreiben oder den Bescheid lesen, interpretieren, seine Richtigkeit und Anwendbarkeit überprüfen, ihn katalogisieren und schließlich beantworten. Das ist ein schwieriger und fehleranfälliger Prozess. Abgesehen von den typischen Dateneingabefehlern können diese Art von Dokumenten im wahrsten Sinne des Wortes untergehen, was zu verpassten Bescheiden, verspäteten Antworten und Tausenden von zusätzlichen Arbeitsstunden führt, um die Situation zu bereinigen.

Im Rahmen einer internen, unternehmensweiten Initiative zur Förderung der Automatisierung durch die Mitarbeiter setzte PwC Augmented Intelligence zum Lesen und Beantworten von Steuerbescheiden ein. Das Tool las viele verschiedene Arten von Formularen und extrahierte und verstand Begriffe und Phrasen, die bestimmte Aktionen erforderten, wie z. B. Fälligkeitsdaten, Bescheidcodes, geschuldete Beträge, Strafen bei Nichtabgabe usw. Das Tool verwendete dann Techniken zur Generierung natürlicher Sprache, um automatisch Antworten zu erstellen, ohne dass diese manuell erstellt werden mussten. In Kombination mit anderen Tools zur Informationsextraktion sowie Lösungen für Compliance, Szenarienplanung und internationale Steuersituationen reduzierte PwC die normalerweise für die Ausführung dieser verschiedenen Aufgaben benötigte Zeit um mehr als 5 Millionen Stunden, was einer Einsparung von 16 % entspricht.

Wenn ein Mensch solche Steuerbescheide stichprobenartig überprüft, handelt es sich um eine Form von erweiterter Intelligenz. Wenn die Antworten jedoch automatisch gesendet werden, handelt es sich um autonome Intelligenz - ein KI-System, das sowohl lernfähig ist als auch selbst Entscheidungen trifft, ohne dass der Mensch eingreift. (Beide Optionen funktionieren; sie werden je nach Risikotoleranz in unterschiedlichen Bereichen eingesetzt.) Unternehmen, die fortschrittliche Mustererkennungstechniken einsetzen, könnten automatisch Trends erkennen, die dazu führen, dass sie bestimmte Bescheide erhalten - z. B. das Einfügen derselben fehlerhaften Informationen in denselben Abschnitt eines Steuerformulars - und so solche Bescheide in Zukunft vermeiden und mehr Zeit und Ressourcen sparen.

Digitale Daten, wie z. B. aus einer Umfrage gewonnene Details, sind ebenfalls mit den Problemen der manuellen Analyse konfrontiert. Wenn ein Unternehmen zum Beispiel eine Mitarbeiterbefragung durchführt, muss jemand die Ergebnisse auswerten und analysieren. Aber selbst wenn die Umfrage online durchgeführt wird (im Gegensatz zu den Antworten auf Papier und Bleistift, was ein erhebliches Risiko von Dateneingabefehlern birgt), muss jemand die Daten zusammenstellen, analysieren und zusammenfassen. Diese Aufgabe, die häufig an Junior-Analysten mit statistischen Grundkenntnissen und -erfahrungen delegiert wird, ist ebenfalls ein Minenfeld für Ungenauigkeiten. Beziehungen zwischen Variablen können falsch sein und dennoch als signifikant und umwälzend bezeichnet werden, was zu fehlerhaften Schlussfolgerungen führt, die wiederum zu fehlerhaften und unzuverlässigen Strategien führen. Ein klassisches Beispiel: Der Verkauf von Speiseeis steht häufig in einem positiven Zusammenhang mit Kriminalität. Natürlich verursacht der Verkauf von Speiseeis keine Kriminalität (oder umgekehrt) - es ist einfach so, dass beide während des heißen Sommerwetters ansteigen.

Der Vergleich von Gruppen, die Einteilung der Befragten in Kategorien und die Prüfung auf signifikante Unterschiede können jedoch automatisiert werden. Darüber hinaus können Techniken zur Verarbeitung natürlicher Sprache bei "freien Antworten" auf Fragen wie "Haben Sie weitere Ideen, wie wir die Sozialleistungen für unsere Mitarbeiter verbessern können?" wichtige oder hervorstechende Themen in den Antworten der Befragten identifizieren, die wichtigsten Punkte zusammenfassen und automatisierte Berichte erstellen, so dass Hunderte oder Tausende von Antworten auf zahlreiche Fragen nicht mehr manuell gelesen werden müssen. Bei der oben gestellten Frage zu den Sozialleistungen könnten so Antworten zu den Themen Gesundheitsversorgung, Flexibilität, Lebensversicherung usw. ermittelt werden. Dennoch erfordern die statischen Empfehlungen dieser KI-Systeme - eine Art von unterstützter Intelligenz - immer noch menschliches Urteilsvermögen und menschliche Entscheidungen.

Werkzeuge des Handwerks

Die KI-gestützte Informationsextraktion kann viele der Ineffizienzen und Probleme lösen, die in den oben genannten Szenarien auftreten. Im Gegensatz zu Robotern, die in der Fertigung zum Punktschweißen oder Lackieren eingesetzt werden, ist die KI-gestützte Informationsextraktion jedoch keine routinemäßige Tätigkeit. Sie erfordert eine Reihe komplexer Data-Science-Techniken mit mehreren dynamischen Komponenten, die sich an die sich ständig ändernden Bedingungen anpassen müssen. Die Integration von Spitzentechnologien wie optischer Zeichenerkennung (OCR), überwachtem maschinellem Lernen und automatisierter Analytik, die die Verarbeitung natürlicher Sprache in einen nahtlosen Prozess einbezieht, erfordert Zeit und technisches Know-how.

Nehmen wir OCR, d. h. die Fähigkeit, gedruckte Zeichen auf einer Seite - sogar handschriftliche Zeichen - unabhängig von Schriftart, Größe, Ausrichtung und Helligkeit zu lesen. Derzeit begegnet uns diese Technologie häufig bei der automatischen Einreichung von Schecks über unser Telefon, wenn die OCR nicht nur die Bankleitzahl und Kontonummer, sondern auch den Scheckbetrag und das Datum liest. OCR ist eine ältere Technologie, aber immer noch unverzichtbar als erster Schritt in dem Prozess, der die relevanten Daten aus den fraglichen Dokumenten sammelt.

Für viele Verwendungszwecke erfordert die Umsetzung dieser Daten in Maßnahmen ausgefeilte Algorithmen für maschinelles Lernen, die Muster erkennen und klassifizieren können. Algorithmen für maschinelles Lernen können an vorhandenen Daten kalibriert werden, um ihre Parameter zu optimieren, und dann auf neue Daten angewendet werden. Sie können so kalibriert werden, dass sie Muster erkennen, die raffinierte, aber subtile Indikatoren für Geldbetrug sind, wie z. B. falsch geschriebene Informationen in einem Kreditantrag oder eine übermäßige Anzahl von Überweisungen oder Bareinzahlungen. Sie können auch ähnliche Bedeutungen in verschiedenen rechtlichen Verträgen aufdecken, zum Beispiel in Ausschluss-, Verjährungs- und Entschädigungsklauseln, die alle mit Ausnahmen zu tun haben.

Darüber hinaus können Algorithmen für maschinelles Lernen einen Datensatz analysieren und eine Reihe von Entitäten in verschiedene Gruppen einteilen. Die automatisierte Kundensegmentierung ist ein bekanntes Beispiel dafür, aber auch die Kategorisierung von Steuerbescheiden, Briefen oder Vertragsklauseln ist möglich und kann enorme Mengen an Zeit sparen, die sonst für das Lesen dieser Dokumente aufgewendet würde.

Die Fortschritte bei der Verarbeitung natürlicher Sprache in den letzten Jahren waren beeindruckend. Obwohl es nicht notwendig ist, die fortschrittlichsten Algorithmen zu verwenden, wie z. B. die Anwendung zur Erzeugung natürlicher Sprache GPT-3, kann die KI-gestützte Informationsextraktion dennoch einige dieser Fortschritte nutzen, indem sie die wahre "Bedeutung" eines Dokuments durch die Identifizierung von kontextbezogenen Wörtern, Wortteilen usw. ermittelt. Die KI selbst versteht nicht, was sie sagt (auch wenn es so erscheinen mag), aber die Algorithmen sind in der Lage, Zusammenfassungen von Dokumenten zu erstellen, Themen zu identifizieren, die (positive oder negative) Stimmung von Prosa zu beurteilen, Schlüsselbegriffe, Bestimmungen oder Klauseln in Dokumenten zu identifizieren und Gruppen von Dokumenten zu erkennen, die ähnliche Maßnahmen erfordern.

Durch die Kombination dieser KI-Techniken ist es möglich, lange Dokumente von Dritten, Konkurrenten oder internen Quellen schnell und einfach zu lesen und zusammenzufassen sowie schnelle und angemessene Antworten zu geben. In einer Anwendung, in der wir nach 35 verschiedenen konzeptionellen Begriffen (z. B. "geltendes Recht" oder "Kündigungstermin") in verschiedenen Dokumenttypen wie Darlehen und Derivaten suchten, trainierten wir das KI-System zunächst mit nur fünf Dokumenten und erhielten einen F1-Wert von 0,28. Ein F1-Score ist ein Maß für die Genauigkeit, das falsch-positive, falsch-negative und richtig-positive Ergebnisse mathematisch zu einem einzigen Score zusammenfasst; ein perfekter F1-Score wäre 1, während ein wertloser F1-Score 0 wäre. Durch weiteres Training mit 565 weiteren Dokumenten stieg dieser F1-Score auf 0,83 - nicht perfekt, aber ziemlich gut.

Jedes neue Dokument bietet mehr Kontext - eine breitere Palette von Beispielen, mit denen der Algorithmus seine Parameter trainieren und seine Genauigkeit erhöhen kann. Es sei jedoch darauf hingewiesen, dass die Genauigkeit nicht allein anhand der F1-Punktzahl gemessen werden kann (ein Modell mit einer F1-Punktzahl von 0,60 könnte beispielsweise genau das liefern, was das Unternehmen benötigt). Die F1-Punktzahl sollte ein Anhaltspunkt sein, aber letztendlich sind es das menschliche Urteilsvermögen und das Fachwissen, die das Modell und seinen Genauigkeitsgrad validieren werden.

Das menschliche Element

KI-Tools sind in der Regel sehr genau, aber wenn sie Fehler machen, können diese unsinnig und geradezu bizarr sein. Die menschliche Aufsicht bei der Implementierung dieser KI-Techniken ist von entscheidender Bedeutung, um die Qualität zu gewährleisten, sowohl bei der Modellschulung als auch bei der abschließenden Korrektur der Ergebnisse in nachgelagerten Prozessen. Eine erfolgreiche Implementierung erfordert also mehr als nur die Beschaffung der Tools. Die Unternehmen müssen auch die folgenden Maßnahmen ergreifen:

Schaffen Sie eine neue Plattform (oder konfigurieren Sie eine bestehende um), die Datenmanagement, Automatisierungstools und KI-Anwendungen kombiniert, aber auch die Menschen auf dem Laufenden hält. Diese Plattform könnte ein zentrales Portal auf Unternehmensebene sein, auf dem Daten gespeichert und ausgetauscht, Anwendungen hoch- und heruntergeladen und die Zusammenarbeit und gemeinsame Entwicklung über eine Kommunikationsschnittstelle gefördert werden können. Diese Plattform sollte für alle Mitarbeiter des Unternehmens zugänglich sein und sowohl für Innovationen und Anwendungen von Mitarbeitern als auch für solche von professionellen Entwicklern offen sein. Natürlich sollte eine solche Demokratisierung dieser leistungsstarken Technologien verantwortungsbewusst erfolgen; die Führungskräfte müssen auf die potenziellen Risiken achten und sich der Notwendigkeit einer angemessenen Schulung und Unternehmensführung bewusst sein.

Entwicklung eines unternehmensweiten Schulungsprogramms mit Schwerpunkt auf digitalem und analytischem Verständnis und Bewusstsein. Alle Mitarbeiter, vom CEO bis zum jüngsten Berufsanfänger, müssen in allen Funktionen geschult werden. Unternehmen sollten in Erwägung ziehen, viele dieser Mitarbeiter nicht nur in der Nutzung dieser zeitsparenden Tools zur Informationsgewinnung zu schulen, sondern auch in den Grundlagen der dahinter stehenden KI-Technologien. Mit einem besseren Verständnis der Fähigkeiten, Risiken, Grenzen und Annahmen der KI werden die Mitarbeiter besser verstehen, wie sie die Tools verantwortungsvoll und effektiv nutzen können. Jedes Unternehmen sollte sicherstellen, dass seine Mitarbeiter mit den aktuellen Technologien vertraut sind, und dieser Wandel wird nur dann greifen, wenn die gesamte Belegschaft mitzieht.

Achten Sie besonders auf die Auswirkungen auf das mittlere Management, für das ein erheblicher Teil der täglichen Aufgaben wegfallen wird. Das ist eine Realität der Automatisierung - sie schafft Effizienzgewinne, indem sie einige Aufgaben übernimmt, die derzeit von Menschen erledigt werden. Die wichtige Botschaft, die den Managern vermittelt werden muss, ist, dass die KI sie in die Lage versetzen wird, sich auf schwierige Probleme zu konzentrieren und an Themen zu arbeiten, die menschliches Urteilsvermögen oder Kreativität erfordern - also mehr Managementaufgaben zu übernehmen und weniger nervtötende, sich wiederholende Aufgaben. 

Bieten Sie den Mitarbeitern auf der taktischen Ebene Anreize für die Nutzung dieser Tools und der neuen Plattform, die über die bloße Nennung von Fakten zum potenziellen ROI hinausgehen. Diese Anreize hängen von der Unternehmenskultur ab, könnten aber KPIs für Leistungsbeurteilungen, Echtzeit-Boni, die Teilnahme an einer Lotterie um einen großen Preis usw. umfassen. Die Schaffung von Anreizen für die erstmalige Nutzung dieser Tools wird ihre Akzeptanz wahrscheinlich beschleunigen. Die Mitarbeiter werden überzeugt sein, wenn sie sehen, wie die Tools ihre Produktivität steigern.

Fördern Sie den Kulturwandel, indem Sie Top-Down-Champions ernennen, die konsequent und häufig die Vorteile der KI-Implementierung kommunizieren. Die Botschaft, dass der Einsatz dieser Tools strategisch richtig ist, positiv gesehen wird und nicht nur für die Kunden des Unternehmens, sondern auch für die Gesundheit und das Wachstum des Unternehmens gut ist, wird die Akzeptanz beschleunigen und die technischen und kulturellen Veränderungen nachhaltig machen.

Als Anwendung von KI mag die Informationsextraktion banal erscheinen, aber ein genauerer Blick zeigt, dass das Gegenteil der Fall ist. Mit automatisierten oder erweiterten Lösungen haben Unternehmen das Potenzial, Prozesse, die traditionell zeitaufwändig und fehleranfällig waren, zu beschleunigen, Möglichkeiten zur Steigerung von Geschwindigkeit und Effizienz zu erkennen und neue Erkenntnisse zu gewinnen, die zu langfristigem Wachstum beitragen. Langweilig war noch nie so aufregend.


NEWSLETTER

Abonnieren Sie unseren Newsletter

Durch Klicken auf die Schaltfläche erklären Sie sich mit unseren einverstanden

Term & Conditions