Ein Bestandteil der Arbeit moderner Compliance-Abteilungen ist heute das Schwärzen von Dokumenten und Dossiers zur Anonymisierung und zum Verbergen von geheimen Informationen vor der Veröffentlichung oder Weiterleitung an Behörden, wie beispielsweise die EFSA (Europäische Behörde für Lebensmittelsicherheit) oder die FDA (Food & Drug Administration). Einen PDF Text unkenntlich zu machen, stellt die Compliance-Abteilungen vor große Herausforderungen. Mehrere tausend Seiten Dossiers müssen durchforstet und entsprechende compliance-relevante Passagen konsequent geschwärzt und anonymisiert werden. Dies ist zeitintensiv und fehleranfällig. Künstliche Intelligenz kann den Compliance-Manager heute bei dieser Herausforderung massiv unterstützen.
PDF Text unkenntlich machen und Metadaten bearbeiten
Nur das Unkenntlichmachen der eigentlich gemeinten Textpassagen reicht bei diesem Prozess nicht aus. Es müssen noch zusätzliche weitere Informationen bearbeitet werden. Zum Beispiel sind das die Metadaten zu einem Dokument, die ansonsten automatisch mit übertragen werden. Dazu gehören auch die Zeitstempel, die dem Leser das Anlagedatum, Änderungsdatum sowie Informationen wie Titel, Autor, Betreff und Schlagwörter liefern. Das Entfernen dieser vertraulichen Informationen ist zwingend, da sie sonst in Kombination mit weiteren Datenschnipseln Rückschlüsse auf bestimmte Personen oder Sachverhalte zulassen. Dadurch können diese Elemente den Datenschutz verletzen.
Dokument richtig schwärzen
Bevor ein Dokument oder Dossier geschwärzt wird, steht die geplante Herausgabe dieser Dokumente, deren Inhalte in Teilen unkenntlich gemacht werden müssen. Die Veröffentlichung von Informationen folgt individuellen Aufträgen, die eine Veröffentlichung und Herausgabe notwendig machen – beispielsweise die bereits erwähnte Übertragung an die EFSA. Ein Compliance-Manager schwärzt daraufhin die Informationen, die nicht für die Öffentlichkeit bestimmt sind und auf keinen Fall veröffentlicht werden dürfen.
Herausforderungen:
– Aufwendige manuelle Kontrolle oft hunderter Seiten
– Fehleranfälligkeit durch den Compliance Manager
PDF Text unkenntlich machen: Dokument digital schwärzen
Idealerweise unterstützt ein Tool den Sachbearbeiter sowohl beim Auffinden schützenswerter Informationen im Text als auch beim automatisierten digitalen Schwärzen dieser Textstellen. Neben der einfachen Dokumentensuche sollten diese Werkzeuge auch Funktionen enthalten, die das Dokument auf der Grundlage zuvor hinterlegter Regeln durchsuchen und die Fundstellen als Vorschlagsliste zur weiteren Bearbeitung ausgeben. Sinnvoll sind solche Funktionen beispielsweise für das Markieren von Personennamen, die grundsätzlich nicht veröffentlicht werden dürfen. Am Ende überprüft der Nutzer, ob die vom Tool vorgeschlagenen Textstellen auch wirklich korrekt geschwärzt sind. Behörden müssen geschwärzte Stellen nachvollziehbar und mit Begründung dokumentieren, falls Widersprüche durch die Veröffentlichung auftreten.
Vorteile einer KI gestützten Software zum Schwärzen von Dokumenten
- Ein Dossier mit 3000+ Seiten kann in 4 Stunden statt einer Woche compliance-konform geschwärzt und anonymisiert werden.
- Der Aufwand für nachträgliche Korrekturen verringert sich um 90 %.
- Die gesamte Durchlaufzeit dieses Prozesses lässt sich mit dem RedactManager um mehr als 80 % reduzieren.
