Datenschutz
Künstliche Intelligenz (KI) hat in den letzten Jahren beeindruckende Fortschritte gemacht und ist auf dem besten Weg, unseren Alltag zu revolutionieren. Von selbstfahrenden Autos über Sprachassistenten sowie Bild- und Textgeneratoren bis hin zu personalisierten Empfehlungen für Online-Shopping und Streaming-Diensten – KI ist allgegenwärtig. Gleichzeitig werfen diese Fortschritte jedoch ernste Fragen zum Thema Datenschutz auf. Denn beim Training und der Nutzung dieser Dienste werden auch erhebliche Mengen an personenbezogenen Daten verarbeitet.
Inhaltsübersicht
Datenschutzrechtliche Aspekte der Nutzung von KI
Die DSGVO verfolgt einen technologieneutralen Ansatz. Sie ist immer dann anwendbar, wenn eine Verarbeitung personenbezogener Daten stattfindet. „Personenbezogene Daten" sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen. Der Begriff wird damit sehr weit verstanden. Erfasst werden Daten wie Namen, Adressen, E-Mail-Adressen, Bankdaten und Gesundheitsdaten. Aber auch dynamische IP-Adressen beziehen sich auf identifizierbare Personen und sind damit vom Anwendungsbereich der DSGVO erfasst. Ausgenommen sind anonymisierte Daten.
Eine „Verarbeitung“ personenbezogener Daten im datenschutzrechtlichen Sinne kann bei KI-Anwendungen an mehreren Stellen erfolgen. KI-Systeme erfordern oft große Mengen an Daten, um trainiert und optimiert zu werden. Die Sammlung und Verarbeitung dieser Daten – auch als crawlen bezeichnet – sowie das nachfolgende Training der KI mit Hilfe dieser Daten stellen Verarbeitungsvorgänge dar, die einer Rechtsgrundlage bedürfen.
Und auch bei der Nutzung von KI-Systemen werden regelmäßig personenbezogene Daten verarbeitet. Etwa bereits bei der Kontoerstellung, bei der Nutzer ihre E-Mail-Adresse und Zahlungsdaten angeben müssen oder während der Verwendung des KI-Dienstes durch Nutzer, sobald personenbezogene Daten in den Prompt eingegeben werden. Die dabei erhaltenen Daten werden zusätzlich häufig noch von den auf Deep Learning basierenden KI-Modellen erfasst und im Rahmen seines kontinuierlichen Selbstlernprozesses weitergenutzt. Auch diese Verarbeitung bedarf einer Rechtsgrundlage.
Die Rechtsgrundlage
Im Datenschutzrecht gilt ein sogenanntes Verbot mit Erlaubnisvorbehalt. Nach Art. 6 DSGVO ist die Verarbeitung personenbezogener Daten grundsätzlich verboten, es sei denn, es liegt nach Art. 6 Abs. 1 DSGVO unter anderem eine der folgenden Rechtsgrundlagen vor:
Einwilligung (lit. a)
Eine Verarbeitung ist nach Art. 6 Abs. 1 lit a DSGVO erlaubt, wenn die betroffene Person ihre Einwilligung zu der Verarbeitung ihrer personenbezogenen Daten für einen oder mehrere spezifische Zwecke gegeben hat. Die Einwilligung muss freiwillig, spezifisch, informiert und eindeutig sein. Die DSGVO hat an diese einzelnen Merkmale recht hohe Anforderungen. Betroffene müssen zum Beispiel genau wissen, wofür sie ihre Zustimmung geben und welche Konsequenzen aus einer erteilten Einwilligung folgen. Dabei muss ihnen insbesondere der Zweck der Verarbeitung erklärt werden.
Für das Sammeln (crawlen) von Trainingsdaten ist die Einwilligung als Rechtsgrundlage regelmäßig ungeeignet, da eine Einwilligung einer jeden Person mit einem unverhältnismäßigen Aufwand verbunden sein dürfte. Im Übrigen liegt noch keine konkludente Einwilligung darin, dass Personen ihre Daten im Internet veröffentlichen und damit rechnen müssten, dass diese Daten verarbeitet werden.
Darüber hinaus ist es sehr problematisch, inwiefern eine Verarbeitung durch KI auf eine Einwilligung gestützt werden kann. Denn die Einwilligung nach der DSGVO muss „in informierter Weise“ erfolgen. Dafür müssen Betroffene hinreichend darüber aufgeklärt werden, wie die KI die Daten verarbeitet. Das ist gerade bei Anwendungen, die auf der Deep-Learning-Technologie beruhen, deren Algorithmen einer Blackbox entsprechen, nur schwer nachvollziehbar. Problematisch ist auch, dass häufig Betroffene unzureichend darüber informiert werden, ob und wie Daten zu Trainingszwecken eingesetzt werden.
Wegen der jederzeitigen Widerrufsmöglichkeit und der großen Hürden der Wirksamkeit sollte an eine Einwilligung nur dann gedacht werden, wenn keine andere Rechtsgrundlage in Betracht kommt.
Vertragserfüllung oder vorvertragliche Maßnahmen (lit. b)
Nach Art. 6 Abs. 1 lit b DSGVO ist eine Verarbeitung erlaubt, die zur Erfüllung eines Vertrags, dessen Vertragspartei die betroffene Person ist, oder zur Durchführung vorvertraglicher Maßnahmen, die auf Anfrage der betroffenen Person erfolgt und dafür erforderlich ist. Auf KI-Anwendungen ist die Norm nur in Ausnahmefällen anwendbar. Beispielsweise könnte man an die Rechtsgrundlage im E-Commerce-Bereich denken, wenn KI zur Personalisierung von Angeboten verwendet wird und das Unternehmen dazu vertraglich auch verpflichtet ist.
Auch Daten, die Nutzer dem KI-Anbieter im Rahmen des Nutzerkontos zur Verfügung stellen – also zum Beispiel Name, Anschrift und Kontodaten – können von der Rechtsgrundlage erfasst sein. Für das crawlen von Trainingsdaten hingegen ist diese Rechtsgrundlage gänzlich ungeeignet.
Berechtigte Interessen (lit. f)
Art. 6 Abs. 1 lit. f DSGVO ist eine der relevantesten Rechtsgrundlagen im Datenschutzrecht. Danach ist eine Verarbeitung immer dann erlaubt, wenn sie „zur Wahrung der berechtigten Interessen des Verantwortlichen oder eines Dritten erforderlich“ ist. Erfasst werden alle rechtlichen, wirtschaftlichen oder ideellen Interessen. Allerdings dürfen die Interessen oder Grundrechte und Grundfreiheiten der betroffenen Person, die den Schutz personenbezogener Daten erfordern, nicht überwiegen.
Das erfordert wiederum eine sorgfältige Abwägung der Interessen. Die Norm gilt im Übrigen auch nicht für Behörden. Die Norm ist Gegenstand zahlreicher Diskussionen. Überlegt werden insbesondere folgende Fallgruppen:
Forschungszwecke
Wissenschaftliche Forschung wird im Datenschutzrecht durch Art. 89 Abs. 1 DSGVO privilegiert. Daher wird diskutiert, ob ein berechtigtes Interesse nicht immer dann besteht, wenn KI im Zusammenhang mit der wissenschaftlichen Forschung eingesetzt oder im Rahmen der wissenschaftlichen Forschung entwickelt wird. Für die Privilegierung als wissenschaftliche Forschung bestehen allerdings enge Voraussetzungen. Gefordert wird eine wissenschaftliche Methodik, eine wissenschaftliche Unabhängigkeit und dass die Ergebnisse der Öffentlichkeit zugänglich gemacht werden. Die meisten - kommerziellen - KI-Anwendungen dürften nicht darunter fallen.
Erhebung von öffentlich zugänglichen Daten
Trainingsdaten für KI-Anwendungen werden regelmäßig aus frei verfügbaren Quellen aus dem Internet gewonnen. Der Vorgang ist nicht neu. Auch die großen Internet-Suchmaschinen durchsuchen im Rahmen der Indexierung mit Hilfe von Bots automatisiert das Internet. Höchstrichterlich entschieden ist, dass sich Suchmaschinen auf die berechtigten Interessen berufen können. Denn den betroffenen Personen ist dieser Vorgang in der Regel bekannt, Suchmaschinen bilden eine wichtige Grundfunktion im heutigen Internet und die betroffenen Personen sind durch das Recht auf Vergessenwerden ausreichend geschützt.
Im Anwendungsfeld von KI-Anwendungen stellt sich allerdings die Frage, ob diese Rechtsprechung übertragbar ist. Ein starkes Argument dafür, dass öffentlich zugängliche Daten weniger schützenswert sind, bietet Art. 9 Abs. 2 lit. e DSGVO. Nach der Vorschrift ist die Verarbeitung von sogenannten sensiblen Daten nicht nach Art. 9 Abs. 1 DSGVO verboten, wenn sich die Verarbeitung auf personenbezogene Daten bezieht, die die betroffene Person offensichtlich öffentlich gemacht haben. Auch die DSM-Richtlinie, die allerdings nur im Urheberrecht Anwendung findet, privilegiert mit den §§ 44b und § 80 d UrhG das Text- und Data Mining.
Die allgemeinen Datenschutzgrundsätze
Die DSGVO legt mit Art. 5 DSGVO eine Reihe von Grundsätzen fest, die bei der Verarbeitung personenbezogener Daten eingehalten werden müssen. So haben Betroffene beispielsweise grundsätzlich das Recht auf Auskunft über die verarbeiteten Daten, das Recht auf Berichtigung von unrichtigen Daten, das Recht auf Löschung der Daten, das Recht auf Einschränkung der Verarbeitung, das Recht auf Datenübertragbarkeit und das Recht, der Verarbeitung ihrer Daten zu widersprechen.
Rechtmäßigkeit, Verarbeitung nach Treu und Glauben, Transparenz
Die Datenverarbeitung muss rechtmäßig, fair und transparent sein. Dabei ist zu beachten, dass die Verarbeitung nur rechtmäßig ist, wenn mindestens eine der in Artikel 6 DSGVO genannten Rechtsgrundlagen erfüllt ist (sh. Oben).
Zweckbindung
Die Daten dürfen nur für spezifische, legitime und ausdrücklich angegebene Zwecke erhoben und verwendet werden. Für KI-Anwendungen bedeutet dies, dass sie so konzipiert sein müssen, dass sie nur die Daten verwenden, die sie zur Erfüllung ihrer spezifischen Aufgabe benötigen und keine Daten für andere Zwecke „mitnehmen“ dürfen. Eine Verarbeitung von personenbezogenen Daten zu Trainingszwecken ist nur dann rechtmäßig, wenn eine Rechtsgrundlage für die zweckändernde Datenverarbeitung vorliegt.
Transparenz und Nachvollziehbarkeit
Betroffenen haben jederzeit das Recht, eine Erklärung der Entscheidungsfindung zu erhalten, die sich auf sie auswirkt. Bei KI kann sich dies jedoch als äußerst schwierig gestalten, da viele KI-Modelle als "Black Boxes" funktionieren, bei denen die genauen Prozesse, die zu einer Entscheidung führen, nicht leicht verständlich oder nachvollziehbar sind.
Datenminimierung und Datensparsamkeit
Nur die absolut notwendigen Daten dürfen erhoben und verarbeitet werden. Dies bedeutet, dass KI-Anwendungen so gestaltet sein müssen, dass sie nur die Daten verwenden, die sie zur Erfüllung ihrer Aufgabe unbedingt benötigen. Der Grundsatz steht in einem offenen Widerspruch dazu, dass KI-Modelle erst dann zu guten Ergebnissen führen, wenn sie durch sehr große Trainingsdatensätze trainiert wurden.
Speicherbegrenzung
Der Grundsatz ist eng verwandt mit den Grundsätzen der Erforderlichkeit, Datenminimierung und Datensparsamkeit. Daten dürfen nicht länger als nötig aufbewahrt werden. Dies bedeutet, dass KI-Anwendungen so konzipiert sein müssen, dass sie Daten löschen, sobald diese für ihren Zweck nicht mehr benötigt werden.
Richtigkeit und Aktualität
Daten müssen korrekt und aktuell gehalten werden. Verantwortliche müssen daher insbesondere Mechanismen zur Überprüfung und Korrektur der Daten bereitstellen. Ungeklärt ist derzeit noch, wie streng der Grundsatz auf KI-Anwendungen anzuwenden ist. Der Grundsatz ist schwierig für KI-Entwickler umzusetzen. Verantwortliche müssten nämlich bei strenger Betrachtung sowohl Trainingsdaten als auch die ausgegebenen Informationen auf Richtigkeit und Aktualität überprüfen. Dass gerade große Sprachmodelle aber regelmäßig auch falsche Informationen ausgeben, dürfte mittlerweile ein weit bekanntes Problem darstellen. Auch die Umsetzung von Lösch- und Berichtigungsansprüchen der Betroffenen stoßen auf praktische Probleme. Die Löschung von falschen Informationen in den Trainingsdaten ist selten ausreichend und die Berichtigung des KI-Algorithmus selbst, das sogenannte „machine unlearning“ ist in der Regel nachträglich nur schwer möglich.
Integrität und Vertraulichkeit
Personenbezogene Daten müssen in einer Weise verarbeitet werden, die eine angemessene Sicherheit gewährleistet, um unbefugten oder unrechtmäßigen Zugriff und Verlust oder Beschädigung der Daten zu verhindern. KI-Anwendungen sind besonderen Angriffsrisiken ausgesetzt. Bereits bei der Entwicklung sollte daher berücksichtigt werden, wie die Anwendung sicher gestaltet und implementiert werden kann. Das Bundesamt für Sicherheit in der Informationstechnik [link einfügen] informiert regelmäßig über allgemeine und KI-spezifische Sicherheitsrisiken.
Rechenschaftspflicht
Der Datenverantwortliche muss in der Lage sein, die Einhaltung der oben genannten Prinzipien nachzuweisen. Für KI-Anwendungen bedeutet dies, dass sie über robuste Überwachungs- und Berichterstattungsmechanismen verfügen müssen, um den Anforderungen dieser Grundsätze gerecht werden zu können.
Haftung und Bußgelder
Die DSGVO sieht strenge Sanktionen für Verstöße vor. Nach Artikel 83 DSGVO können Unternehmen, die gegen die DSGVO verstoßen, mit Geldbußen von bis zu 20 Millionen Euro oder 4% ihres weltweiten Jahresumsatzes belegt werden, je nachdem, welcher Betrag höher ist. Darüber hinaus können betroffene Personen gemäß Artikel 82 DSGVO Schadenersatz verlangen, wenn sie durch einen Verstoß gegen die DSGVO materiellen oder immateriellen Schaden erlitten haben.
Fazit
Die Konformität mit der DSGVO bei der Verwendung von KI ist eine komplexe Herausforderung, die eine gründliche Kenntnis der Vorschriften und eine sorgfältige Planung und Umsetzung erfordert. Bei richtiger Handhabung kann sie jedoch nicht nur rechtliche Risiken minimieren und das Vertrauen der Nutzer stärken, sondern auch dazu beitragen, ethischere und verantwortungsvollere KI-Systeme zu entwickeln, die die Privatsphäre der Nutzer respektieren und schützen. Es ist daher unerlässlich, dass Unternehmen und Organisationen, die KI einsetzen, die Anforderungen der DSGVO ernst nehmen und sich bemühen, diese in ihre Praktiken und Prozesse zu integrieren.
Können wir Sie bei Projekten im Bereich KI unterstützen?
Gerne stehen wir Ihnen zu einem ersten Gespräch zur Verfügung. Um einen Termin zu vereinbaren, kontaktieren Sie uns gern per E-Mail kontakt@recht-im-internet.de oder telefonisch unter 0511 374 98 150.
Weitere Informationen finden Sie auf unserer Kanzlei-Website recht-im-internet.de sowie auf unserem Blog netzrechtliches.de.