Mit dem Computer über Recht sprechen

Erster Teil: Welche Sprache spricht der Computer?

24. September 2020   •   Lesedauer: 5 Minuten

Könnte eines Tages dort, wo heute der Jurist sitzt und vom Sachverhalt auf die Rechtslage schließt, ein eigenständig arbeitender Roboter sitzen? Dem einen mag dies als Dystopie, dem anderen als Utopie erscheinen, aber zugegebenermaßen geht es uns hier gar nicht um die Skizzierung eines solchen extremen Szenarios. Vielmehr möchten wir mit diesem und den folgenden zwei Beiträgen eine Einführung in die Welt der Sprache der Computer schaffen, die aufzeigt, wie der Schritt vom Sachverhalt zum rechtlichen Ergebnis schon heutzutage durch oder gemeinsam mit dem Computer als Unterstützer teilweise möglich ist.

Um von einem, Umstände aus der realen Welt beschreibenden, Sachverhalt zu einer rechtlichen Auffassung zu kommen, muss dieser zunächst verarbeitet werden. Bei dem juristischen Sachverhalt handelt es sich in der Regel um einen Text, eine sprachliche Äußerung.

Die Sprache ist bekanntermaßen ein juristisches Handwerkszeug. Aber auch die Informatik arbeitet mit verschiedenen Arten von natürlichen und mathematischen Sprachen. Daher wollen wir uns der Welt der Computer im ersten Schritt über die Sprachen annähern.

Was ist überhaupt Sprache und wofür ist sie gut?

Eine Sprache ist ein strukturiertes System der Kommunikation. Unter die Begrifflichkeit fallen nicht nur die menschlichen natürlichen Sprachen, die sich über die Jahrtausende entwickelt haben, sondern auch konstruierte Sprachen.

Die natürlichen Sprachen des Menschen können zur Kommunikation gesprochen oder (auch zur dauerhaften Speicherung von Informationen) geschrieben werden, oder aber in anderen Medien kodiert werden. Man denke an Braille oder Gebärdensprache.

Sprache findet auf mehreren Ebenen statt. In der ersten Ebenen treffen wir auf eine begrenzte Anzahl von Lauten und Zeichen, die in der zweiten Ebene zur eine unbegrenzten Anzahl von Wörtern und Phrasen kombiniert werden können. In der nächsten Ebene der Sätze liegt die Verknüpfung der Zeichenabfolge und Phrasen mit Inhalten und Bedeutung.

Dabei ergibt sich ein hoher Grad der Komplexität, denn oft lassen sich Zeichen und Bedeutung nicht zweifelsfrei verknüpfen. Selbst für Teilnehmer desselben Kulturkreises können dieselben Zeichen bereits unterschiedlich verstanden werden.

Der Mehrdeutigkeit von Zeichen, Wörtern und deren Satzverknüpfungen in der natürlichen Sprache können wir Menschen ganz pragmatisch mit unserem erlernten Sprachgefühl und unserer „Intuition” nach einiger Zeit begegnen. Dementgegen fehlt der Maschine dieses erlernte und angeborene Gefühl für die Sprache. Diese Aussage mag verwirren, verwenden wir doch in unserem Alltag Sprachassistenten und Übersetzerdienste, die sehr wohl ein (intuitiv wirkendes) Verständnis für unsere natürliche Sprache zu haben scheinen. Indes wollen wir das Pferd nicht von hinten aufzäumen. Stattdessen werden wir uns dem Ziel der Sachverhaltsanalyse schrittweise nähern und daher mit einem grundlegenden Blick darauf, was ein Computer ist und wie dieser mit Sprache umgehen kann, beginnen.

Ein Computer ist eine Rechenmaschine. Durch die Verschaltung vieler (Millionen) Transistoren, die entweder die Zustände „An“ oder „Aus“ annehmen können, wird aus diesen „simplen“ physikalischen Bauteilen ein programmierbares Rechenwerk, also eine Maschine die gemäß vom Menschen übergebener Befehle elektrische Schaltungen steuert und dabei einen Prozess vorantreibt. Die erste Rechenmaschine dieser Art wurde bereits vor mehr als 70 Jahren vom deutschen Erfinder Konrad Zuse ins Leben gerufen und befüllte damals mehrere Räume. Die Funktionalität war wenig umfangreich und beschränkte sich auf simple Rechenoperationen.

Der Computer verarbeitet auch heute wie damals Zahlen. Zwar erhält er nicht wie zu seiner Entstehungszeit bloß Zahlen als Eingabe und gibt diese wieder aus, aber auch bei der Eingabe von Buchstaben, natürlicher Sprache und Tönen wandelt der Computer aufgrund seiner physikalischen Beschaffenheit die Eingabe in Zahlen um und verarbeitet diese dann. So bleibt auch das Smartphone, das sprachgesteuert Einträge der Einkaufsliste hinzufügt buchstäblich eine Rechenmaschine.

An diesem Beispiel wird deutlich, dass zwischen der Verarbeitung der Befehle auf Maschinenebene, die im wesentlichen nur binären Code verarbeiten kann, weitere Ebenen der Transkription liegen müssen. Für eine planbare Durchführung der mathematischen Operationen, die dem Computer seine Funktionalität verleihen, muss also zumindest ein fester Befehlssatz – eine feste Sprache – mittels derer der Mensch mit der Maschine für diese klar verständlich sprechen kann, existieren.

Mit der Verwendung natürlicher Sprache kommt man auf dieser Stufe nicht weiter, da Begrifflichkeiten, wie oben näher beschrieben, nicht zweifelsfrei definiert sind. Wenn dem Computer z.B. mitgeteilt werden soll „speichere den Faktor der Variablen a und b in der Variable c” darf der Computer keine Interpretationsmöglichkeiten haben.

Damit werden hochgradig effektive Sprachen benötigt, die keinen Raum für Missverständnisse bieten. Dies sind die formalen Sprachen, die von den natürlichen Sprachen abzugrenzen sind. Zum Faktor der Zweifelsfreiheit gesellt sich auch das Kriterium der Prägnanz, denn zu Beginn der elektronischen Datenverarbeitung war Speicherplatz nur über eine signifikante räumliche Ausdehnung der Speichermedien zu erreichen.

Der Unterschied zwischen natürlichen und formalen Sprachen

Doch wie beschreibt man Sprachen so präzise und vollständig, dass keine Interpretation mehr möglich ist und kein Spezialfall vergessen geht? Es bedarf einer systematischen, formalen Sprachbeschreibung.

Von natürlichen Sprachen her kommend gilt für Sprachen im Allgemeinen folgendes: aus einem Wortvorrat (verfügbare Vokabeln) wird mittels einer endlichen Menge grammatikalischer Regeln zum Satzbau (Syntax) mit der objektiv gültigen Bedeutung (Semantik) und subjektiver Bedeutungszuweisungen eine subjektive Bedeutung für den Benutzer (Pragmatik) geschaffen.

Damit ist evident, dass die formalen Sprachen zumindest keine solche subjektive Bedeutung (Pragmatik) zulassen können; semantisch darf einem Ausdruck nur eine Bedeutung zugewiesen werden.

Auch bestehen insoweit syntaktische Unterschiede, als die formale Sprache effizient vom Computer verarbeitet werden muss. Ein mathematischer, logischer Aufbau ist die Folge (der hier aufgrund der abstrakten mathematischen Beschreibung nicht vertieft werden soll). Gleich bleibt, dass auch die natürliche Sprache eine syntaktisch korrekte Bildung der Sprachelemente erfordert.

Vom juristischen Sprachgebrauch zur Maschinensprache

Interessant ist für uns nun die Frage, ob und wie wir die Brücke von der natürlichen juristischen Sprache hin zur formalen Computersprache schlagen können. Für eine solche Herangehensweise scheint ja zunächst zu sprechen, dass in der Juristerei selbst formale Konzepte bestehen. Entweder ist A oder B Eigentümer einer Sache oder C hat sich nach einer Norm strafbar gemacht. Ebenso folgen die gesetzlichen Tatbestände mit Tatbestandsmerkmalen, die einzeln, alternativ oder kumulativ erfüllt sein können (und müssen), damit also durch die Gesamtheit ihres Vorliegens aussagen, ob ein Tatbestand erfüllt ist, formalen Regeln. Vor diesem Hintergrund wird klar, dass es auch eine Aufgabe des Juristen ist, die formalen juristischen Konzepte in natürliche Sprache umzuwandeln (Gesetzestexte, Erklärungen ggü. Laien, Schriftsätze, etc.) und aus in natürlicher Sprache niedergeschriebenen Texten formale juristische Konzepte zu extrahieren.

Demzufolge könnte in der Theorie dem Juristen ein Computerprogramm zur Hand gegeben werden, welches formale Eingaben des Juristen erhält und diese Daten mit einem Modell gesetzlicher Tatbestände abgleicht.

Expertensysteme und die Anfänge computergestützter Bearbeitung juristischer Problemstellungen

Im einfachsten Falls handelt es sich um sogenannte Expertensysteme, d.h. Systeme, die vordefinierte juristische Prüfungsschemata abarbeiten, die in Flussdiagramm-Strukturen visualisiert werden können. Die ersten Expertensysteme wurden ohne der Zuhilfenahme von Computern konzipiert und angewendet.

Beim Einsatz eines Computers, können hier nun ganz einfach alle Merkmale eines Tatbestandes durchlaufen werden und der Jurist, der den Computer bedient nach jedem Teilschritt erneut befragt werden, ob dieses oder jenes Merkmal erfüllt ist. Vorteilhaft ist, dass der Computer durch das Vorhandensein einer Modellierung des gesetzlichen Tatbestandes effizient immer nach denjenigen Merkmalen fragen kann, die nicht schon aufgrund der vorausgegangenen Antworten gar nicht mehr erfüllt sein können oder sein müssen.

Zweifelsohne vereinfachen solche Expertensysteme den Arbeitsalltag des Juristen. Indes entspricht das nicht gerade der Eingangs aufgezeigten Vision, dem Computer einfach den Sachverhalt zu übergeben und ein Ergebnis zu erhalten. So wollen wir zur Unterstützung trivialer Probleme eigentlich Programme nutzen, die natürliche Sprache verstehen, ein Sprachgefühl und Kontextbewusstsein haben.

Natürliche Sprache und Machine Learning

Könnte man daher nicht einfach die natürliche Sprache formal abbilden? Auf der Ebene der Syntax wäre dies durchaus möglich, semantisch scheitert man indes aufgrund der Komplexität und inhärenten Mehrdeutigkeit natürlicher Sprache daran, eine effizient verarbeitbare formale (semantische) Grammatik für natürliche Sprachen aufzustellen. Aufgrund der Mehrdeutigkeit, der Pragmatik und des ständigen Bedeutungswandels wäre dies gar nicht abschließend möglich. Wenn wir uns nun nach Computerprogrammen sehnen, die natürliche Sprache „verstehen“, kommen wir an künstlicher Intelligenz, die durch millionenfaches Sprachtraining ein „Bewusstsein für natürliche Sprache” entwickelt nicht vorbei. Um also unserem Ziel, des Computerprogramms, welches Sachverhalte liest und verarbeitet, näher zu kommen, werden wir uns im nächsten Teil unserer Reihe einem Teilbereich der künstlichen Intelligenz, dem „Natural Language Processing“ widmen. Auf diese Weise wollen wir es schaffen, das Problem der formalen Sprachen zu „umgehen”.

Teil 2 und 3 der Serie: „Mit dem Computer über Recht sprechen“ werden in den nächsten Wochen erscheinen.

Folgt uns jetzt auf Linkedin, Facebook und Instagram um über neuen Teile der Serie informiert zu werden. Falls euch die Serie gefällt, würden wir uns auch über Feedback auf unseren Kanälen freuen.