Contract Analytics: Intelligentes Vertragsmanagement der Zukunft

Die Fortschritte im Bereich der Künstlichen Intelligenz – insbesondere beim maschinellen Lernen (ML) und der Verarbeitung und Interpretation von Sprache (NLP: natural language processing/NLU: natural language understanding) – bieten viele Möglichkeiten zur Erschließung und Analyse von Verträgen. Das Vertragsmanagement kann also schon heute weit mehr sein als die systematische Erstellung und Verwaltung von Verträgen.

Der Autor Dr. Mathias Bauer ist Partner bei Lighthouse Germany

Aktuell endet die Digitalisierung im Vertragsmanagement allerdings oft damit, dass die oft in Papierform vorliegenden Dokumente elektronisch erfasst werden.

Oft ist dies der Fall, wenn es beispielsweise zu Gesetzesänderungen (Stichwort DSGVO) kommt. Betroffene Verträge können so schneller identifiziert werden.

Neue Bilanzierungsstandards wie IFRS16 können es erforderlich machen, dass zahlreiche Attribute aus Verträgen ausgelesen und tabellarisch zusammengefasst werden.

Aber auch die Überprüfung, ob Compliance-Regeln eingehalten werden oder die Schaffung eines systematischen Überblicks über Vertrags-Sammlungen erfordern zunehmend den Einsatz intelligenter Techniken.

Ein manueller Ansatz ist bei solchen Aufgabenstellungen meist nicht praktikabel.

Was ist die Alternative?

Sprache in Verträgen weist meist keine allzu große Varianz auf. So ist es häufig bereits völlig ausreichend, ein Set an Extraktionsregeln zu schreiben, anstatt ein Extraktionsmodell mittels maschinellen Lernens zu erzeugen.

Reicht regelbasiertes Vorgehen nicht aus, können Modelle auf Basis von Beispieldaten trainiert werden. Diese sind in der Lage, einzelne Datenpunkte wie Vertragspartner, Gerichtsstand usw. aus einem Fließtext zu extrahieren und in eine Datenbank zu schreiben.

Diese strukturierte Datengrundlage erlaubt etwa interaktive Visualisierungen in Form von Dashboards, die ad-hoc-Abfragen wie etwa „zeig mir alle Verträge mit Restlaufzeit < 6 Monate“ erlauben.

Neben der Informations-Extraktion spielen intelligente Techniken – insbesondere bei der Klassifikation von Verträgen oder Vertragsabschnitten – eine zentrale Rolle.

Hier wird maschinelles Lernen eingesetzt, um wiederum anhand von Trainingsbeispielen ein Modell zu erzeugen. Dieses Modell kann ein gesamtes Dokument einer bestimmten Vertragsklasse zuzuordnen – wie zum Beispiel Leasingvertrag, Mietvertrag usw. – oder Textabschnitte identifizieren, die in Bezug auf eine konkrete Fragestellung relevant sind.

Im oben bereits erwähnten Fall der DSGVO würde es zum Beispiel darum gehen, die Datenschutzklausel zu finden. Bei anderen Anwendungen könnten die Stornoklausel oder Klauseln zu Vertragsstrafen von Interesse sein.

In jedem Fall kann der Einsatz solcher Techniken zu einer erheblichen Reduktion des manuellen Aufwands für Expertenteams führen. Diese müssen sich dann nämlich nur mit den vom System gefundenen Textabschnitten beschäftigen, statt sich durch den gesamten Vertragstext zu arbeiten, um die relevante Stelle zu finden.

Exkurs: Kurze Erklärung zentraler Grundbegriffe

Da in jüngster Zeit Begriffe rund um Künstliche Intelligenz (KI) geradezu inflationär gebraucht werden, sollen an dieser Stelle kurz ein paar der grundlegenden Konzepte geklärt werden.

KI selbst ist eine Teildisziplin der Informatik. Sie beschäftigt sich mit der Entwicklung von Systemen, die Aufgaben lösen, für die ein Mensch seine eigene Intelligenz einsetzen müsste.

Ein zentrales Teilgebiet der KI ist das maschinelle Lernen. Hier geht es darum, Systeme nicht explizit nach dem Prinzip „wenn A, dann B“ zu programmieren, damit sich ihr Verhalten verändern kann.

Stattdessen werden ihnen Trainingsdaten zur Verfügung gestellt, aus denen die Systeme mittels unterschiedlicher Verfahren Muster extrahieren, die in Form eines Modells auf bisher unbekannte Daten angewandt werden können.

Ein solches Modell repräsentiert beispielsweise das Wissen, wie unerwünschte Emails aussehen. Mit einem Spam-Filter können Email-Programme dann dafür sorgen, dass wir diese Mails nicht mehr erhalten.

Unter den Verfahren, die zum maschinellen Lernen eingesetzt werden, spielen neuronale Netze eine immer wichtigere Rolle. Sie bilden den Kern beim sogenannten Deep Learning.

Künstliche Intelligenz

Deep Learning wurden unter anderem durch den spektakulären Sieg gegen den weltbesten Go-Spieler allgemein bekannt. Heute wird die Technologie unter anderem bei der Erkennung und Verarbeitung gesprochener Sprache, von Bildern und Videos eingesetzt. Sie wird außerdem ein unverzichtbarer Bestandteil für autonome Fahrzeuge sein.

Auch wenn solche Verfahren zuverlässige Modelle generieren können, sind sie nicht für jede Art von Anwendung gleichermaßen einsetzbar.

Insbesondere Deep Learning benötigt vergleichsweise große Mengen an Trainingsdaten. Diese sind nicht überall in ausreichender Qualität verfügbar, wie wir am Beispiel der Contract Analytics noch sehen werden.

Maschinelles Lernen kommt ebenfalls bei der Verarbeitung natürlicher Sprache (NLP) zum Einsatz, wird dort aber ergänzt durch linguistische Verfahren, die Wortstämme erkennen und Sätze in ihre grammatikalische Struktur zerlegen können.

Auf Basis der so gewonnenen Information können relativ einfache Regeln zur Extraktion relevanter Information aus Texten entweder manuell erstellt oder wiederum durch ML gelernt werden.

Anwendung in der Vertragsanalyse

Wir haben oben bereits die typischen Aufgabenstellungen im Zusammenhang mit Contract Analytics kennen gelernt: Extraktion relevanter Inhalte aus einem Text und Klassifikation von Dokumenten bzw. Dokumentabschnitten.

Welcher Aufwand ist nun seitens des Anwenders zu leisten, um die erforderlichen Modelle zu erstellen?

Prinzipiell ist die Bereitstellung von gelabelten Trainingsdaten erforderlich. Das bedeutet, dass jedes Trainingsbeispiel mit dem erwarteten Output, dem Label, versehen werden muss.

Im Fall der Informationsextraktion sind dies alle zu findenden Einzelinformationen wie Vertragsparteien, Start- und Enddatum, Gerichtsstand etc.

Gerade bei längeren Vertragstexten ist dies ein verhältnismäßig aufwändiger, manueller Prozess. Verwendet man für eine solche Aufgabe einen Deep-Learning-Ansatz, kann dies bedeuten, dass eine vier- bis fünfstellige Anzahl an Verträgen manuell durchgearbeitet werden muss, um das notwendige Trainingsmaterial bereitzustellen.

Dr. Mathias Bauer ist Partner bei Lighthouse Germany. Bild: KPMG

Bei der Klassifikation ist die Situation etwas einfacher. Hier müssen lediglich die einzelnen Trainingsdokumente oder -abschnitte mit ihrer jeweiligen Klassenzugehörigkeit versehen werden. Dies kann bei kompletten Dokumenten etwa „Leasingvertrag“ oder „Kaufvertrag“ sein, bei Abschnitten beispielsweise „Stornoklausel“ oder „Datenschutzklausel“. Hier genügt in der Regel eine dreistellige Zahl an Trainingsbeispielen, die zudem relativ einfach zu labeln sind.

Um den Aufwand bei der Bereitstellung von Trainingsdaten zu minimieren, kann zusätzliches Expertenwissen verwendet werden. Ein Experte kann zunächst die relevanten Klauseln innerhalb der Trainingsdaten auflisten und für jede davon eine kleine Anzahl von Beispielen markieren. Hier genügt es dann im Regelfall, Extraktionsregeln zu erstellen, die sich auf die Suche innerhalb des Textes einer solchen Klausel beschränken.

Es folgt der Extraktionsprozess. Zuerst wird über ein Klassifikationsmodell der relevante Textabschnitt identifiziert. Dann werden innerhalb dieses Abschnitts die Extraktionsregeln angewandt.

Schon die Tatsache, dass innerhalb eines kürzeren Textes etwa deutlich weniger Datumsangaben vorkommen, führt zu einer Verbesserung der Erkennungsgüte bei gleichzeitig geringerem Aufwand.

Neben der Anzahl der verfügbaren Trainingsbeispiele ist natürlich auch deren Qualität von zentraler Bedeutung.

Dabei sind zwei Aspekte zu berücksichtigen: Zum einen ist das die technische Qualität (hochwertiger Scan für die Weiterverarbeitung).

Zum anderen deren Repräsentativität: Die Beispiele, die während der Trainingsphase zur Verfügung gestellt werden, müssen ungefähr dem entsprechen, was das System in der Zukunft zu verarbeiten haben wird.

Oder anders ausgedrückt: Wenn man ein System nur mit Leasingverträgen trainiert, wird es später nicht in der Lage sein, Dienstleistungsverträge in vergleichbarer Qualität und Vollständigkeit zu analysieren.

Zusammenfassung

Contract Analytics mit Hilfe intelligenter Systeme bedeutet zunächst einen gewissen Vorbereitungsaufwand. Dieser lässt sich aber mit geeigneten Verfahren und Expertenwissen deutlich reduzieren.

Die Qualität der Trainingsdaten – angefangen bei deren technischer Erfassung bis zur Zuordnung von Labeln – ist von entscheidender Bedeutung für die zu erwartende Performanz des Systems.

Ein gutes Contract-Analytics-System gibt es daher nicht von der Stange, sondern muss im Normalfall auf die aktuellen Gegebenheiten angepasst werden.

Dann allerdings eröffnet es Möglichkeiten, die weit über das hinausgehen, was mit manueller Arbeit geleistet werden kann. In absehbarer Zukunft werden dazu auch semantische Vergleiche inklusive Mehrsprachigkeit gehören und das Potential der Contract Analytics nochmals erweitern.

Kontakt zu KPMG

KPMG AG Wirtschaftsprüfungsgesellschaft
Klingelhöferstraße 18
10785 Berlin
Tel.: +49 30 20680
E-Mail: information@kpmg.de
Website: www.kpmg.de

Ebenfalls interessant:

https://industrie.de/kuenstliche-intelligenz/interview-juergen-bock-kuenstliche-intelligenz-kuka/

Unsere Webinar-Empfehlung

Webinar: Sophos GmbH

Geschäftsführersache IT-Sicherheit – senken Sie Ihr Risiko gegen Null

2021 waren 84% der Betriebe in Deutschland Ziel eines Ransomware-Angriffs (Quelle:bitkom). Laut Allianz Riskbarometer 2022 sind Cyberangriffe das Top-Geschäftsrisiko. Erfahren Sie in unserem Webinar was ein MDR-Service ist und wie dadurch das Risiko gegen Null gesenkt werden…

Zurück zur Startseite