Datenschutzbeauftragter Aachen | Externer Datenschutzbeauftragter Aachen | Ingo Goblirsch LL.M. | 15+ Jahre Erfahrung

DSGVO-Gazette #32: ChatGPT, KI-basierte Sprachsysteme und die DSGVO

Liebe Leserinnen und liebe Leser,

eigentlich könnte angenommen werden, dass ChatGPT, Alpaca, LLaMA oder andere KI-basierte Sprachsysteme ein Segen für die Gesellschaft ist. Roboter nehmen uns Arbeit ab und bringen uns so - ohne weiteres Zutun - näher an das Ziel "Wohlstand für alle" heran. Nehmen wir einmal diesen Blog - es wäre doch super, wenn der sich alleine schreiben würde. Entsprechend habe ich ein KI-basiertes Sprachsystem danach gefragt eine Einleitung für diesen Artikel zu schreiben. Heraus kam:

Künstliche Intelligenz (KI) und Sprachsysteme haben in den letzten Jahren immense Fortschritte gemacht und sind in vielen Branchen weit verbreitet. Obwohl KI-Sprachsysteme viele Vorteile bieten, werfen sie auch datenschutzrechtliche Fragen auf. In diesem Blogartikel werden wir uns mit den wichtigsten datenschutzrechtlichen Aspekten des Einsatzes von KI-basierten Sprachsystemen auseinandersetzen. Wir werden uns mit Fragen wie der Datensicherheit, der Datenspeicherung und der Datenverarbeitung beschäftigen und aufzeigen, welche Schritte Unternehmen und Organisationen ergreifen können, um sicherzustellen, dass ihre KI-Sprachsysteme datenschutzkonform sind. Dabei werden wir auch auf aktuelle datenschutzrechtliche Bestimmungen eingehen und Ihnen Tipps geben, wie Sie als Nutzer solcher Systeme Ihre Daten schützen können. Ob Sie nun ein Unternehmen sind, das KI-Sprachsysteme einsetzt, oder einfach nur ein interessierter Verbraucher, dieser Artikel wird Ihnen wertvolle Informationen und Ratschläge liefern.

Beim Lesen dieser (und weiterer Antworten) war ist zuerst einmal sehr beeindruckt von der inhaltlichen Treffsicherheit und Qualität der Ausgabe. Dieses Werkzeug muss nur noch datenschutzkonform nutzbar sein. Kommen wir jedoch aus meiner Sicht zu einem des wesentlichsten datenschutzrechtlichen Problem im Umgang mit einer solchen Software. Abseits der Diskussion um Deep-Fakes, AI-erzeugte Videos, Sprache, Bilder oder den eigenen Hacking-Skills dieser Systeme liegt aus meiner Sicht das größte datenschutzrechtliche Problem von KI-basierten Sprachsysteme darin, dass sie nicht Vergessen und einen unstillbaren Hunger auf neue Daten haben:

Ein Beispiel: Meine erste Anfrage "Warum eignet sich die Odysseus-Sage besonders gut für ein Adventure-Spiel?" ist weiterhin in der Historie vorhanden, wenn ich mich bei meinem bevorzugten KI-basierten Sprachsystem anmelde. Auch wenn ich mit der Antwort nichts weiter angefangen habe (O-Ton: "Das merkt meine Lehrerin direkt, Papa"), ist es doch gruselig. Ähnlich zu den Übersetzungsportalen wie Google Translate oder Deepl würde ich jedoch nicht auf die Idee kommen dort vertrauliche oder personenbezogene Daten einzutragen. Nur da gehöre ich wohl nicht zu der Mehrheit der Nutzer. Viele kopieren ungefiltert vertrauliche Daten in KI-basierte Sprachsysteme. Was diese Systeme dann mit diesen Informationen machen, ist unklar.

Die neuste Version von ChatGPT akzeptiert beispielsweise auf einmal 50 Seiten Text und kann diesen Text interpretieren und angemessen darauf reagieren. Werden diese Systeme mit Daten trainiert, die von produktiven Daten abstammen, wird jede noch so gut gemeinte Anonymisierungsmethode durch die Kombination mehrerer Daten zueinander ad-absurdum geführt werden. Die bisher aufgetauchten Datenpannen wie die offenen Zahlungsinformationen von Premium-Konten oder die einsehbaren Chat-Verläufe anderer Nutzer sind nur die Spitze dessen, was KI-Daten der Welt preisgeben können.

Aus meiner Sicht sind folgende Punkte (mindestens) wichtig, um die weitere Entwicklung von KI datenschutzfreundlich zu gestalten:

  • Transparenz: Es sollte mehr Transparenz über die Datenverarbeitung von KI-basierten Sprachsystemen geben, damit Benutzer verstehen können, welche Daten erfasst werden und wie sie verwendet werden.
  • Intervenierbarkeit: Betroffene müssen ihre Rechte jederzeit wahrnehmen und wirksam geltend machen können.
  • Kontrolle: Benutzer sollten die Kontrolle über ihre Daten haben und in der Lage sein, zu entscheiden, welche Daten erfasst und wie sie verwendet werden.
  • Anonymität: Es sollte gewährleistet sein, dass Benutzerdaten nicht missbraucht werden, um Benutzer zu identifizieren oder zu verfolgen.

Apropos Transparenz: Alle in kursiv dargestellten Bloginhalte stammen von der KI.

Viele Grüße aus der Kaiserstadt Aachen

Ingo Goblirsch

Ingo Goblirsch LL.M.

Externer Datenschutzbeauftragter
Datenschutz | Compliance | Informationssicherheit
52076 Aachen

Foto von Andrea De Santis auf Unsplash. Danke!