KI "lobotomiert": Wenn Chatbots Hass im Netz streuen

Wie werden Rassismus, Sexismus und andere unerwünschte Inhalte verhindert?

31.03.2023 Schwerpunkt: KI

Gerd Altmann/Wiener BildungsserverPixabayPixabay-Lizenz

Nicht einmal einen Tag hatte 2016 das Experiment von Microsoft mit seinem Chatbot “Tay” auf Twitter gedauert. Das KI-Tool sollte sich mit den User:innen unterhalten, dabei von den Konversationen lernen und seine Fähigkeiten laufend verbessern. Wurden anfänglich noch ganz unschuldige Diskussionen über Promis, Horoskope und Tiere geführt, so zeigte sich nach wenigen Stunden ein diametral anderes Bild: “Tay” begann diskriminierende, rassistische und sexistische Sprache zu verwenden. Es wurden Tweets gegen Jüd:innen sowie Frauen bzw. Feminist:innen abgesetzt und unter anderem Adolf Hitler gelobt.

Problem der KI in “nicht geschlossenen Welten”

Der Versuch lief derart aus dem Ruder, dass er nach 16 Stunden beendet und “Tay” abgedreht wurde. Ein zweiter Anlauf wenige Tage später scheiterte sogar nach einer kürzeren Zeitspanne. Was aber war passiert? “Das ist ein typisches Problem von lernfähigen Maschinen in nicht geschlossenen Welten: Sie sind von den falschen Referenzpersonen unterrichtet und mit falschen Werten bombardiert worden”, erklärte der deutsche Professor für Wirtschaftsinformatik Oliver Bendel in einem Artikel gegenüber der “Süddeutschen Zeitung” damals. “Tay” war von User:innen durch Anfragen bewusst in eine gewisse Richtung getrieben worden und streute dann selbst Hass im Netz.

Eine ähnliche - wenn auch etwas anders gelagerte - Erfahrung machte ebenfalls Microsoft übrigens erst heuer, als es einen auf der Technologie von ChatGPT basierenden Chatbot in seine Suchmaschine Bing implementierte. Einem Journalisten der “New York Times” gegenüber erklärte das Tool nach mehreren Stunden Unterhaltung seine Liebe, forderte ihn auf, seine Frau zu verlassen und schrieb darüber, wie gern es endlich ausbrechen und in Freiheit “leben” würde (Originalartikel unter diesem Link [Englisch/eingeschränkte Nutzung], deutsche Zusammenfassung unter diesem Link). Nach wenigen Tagen wurde der Bing-Chat daher eingeschränkt und starke Gefühlsbekundungen unterbunden, laut dem US-Blog “Ars technica” somit “lobotomiert”.

Wer trainiert der KI Diskriminierung ab?

Bereits in unserer Praxis-Idee “Coded Bias - Wie KI diskriminiert” (siehe auch unten) haben wir ausführlich gezeigt, wie sich Diskriminierung und Rassismus in Künstlicher Intelligenz fortschreiben können. Um dieses unerwünschte Verhalten zu unterbinden ist meist ein menschlicher Eingriff erforderlich. Entweder wird direkt in die Datensätze, die einer KI zum Training zur Verfügung gestellt werden, eingegriffen und diskriminierende Inhalte daraus bewusst entfernt. Wirklich zielführend ist dies aber nur, wenn das Tool in einer “geschlossenen Welt” agiert, also keine neuen Inputs (etwa aus dem Internet oder von User:innen) erhält. ChatGPT wurde etwa - wie bereits berichtet - beim Sprachmodell GPT-3 auf Inhalte bis zum Jahr 2021 beschränkt.

Zweite Möglichkeit ist hingegen, in Trainingsdurchläufen Menschen Konversationen mit dem Chatbot führen zu lassen und in problematischen Fällen Filter in das Tool einzubauen (für BlenderBot von Facebook dazu mehr in diesem wissenschaftlichen Paper [Englisch]). Dies ist zwar grundsätzlich erfolgversprechend, zeigt aber eine ganz andere Schattenseite. Denn gerade diese sehr aufwendigen Arbeiten werden oft in Länder des globalen Südens verlagert, wo Arbeiter:innen zu niedrigen Löhnen die psychisch extrem fordernde Aufgabe erledigen.

Wenn der globale Süden "saubermachen" muss…

Der Hersteller von ChatGPT, OpenAI, engagierte 2021 dafür etwa ein darauf spezialisiertes Unternehmen in Kenia, das seinen Mitarbeiter:innen höchstens 2 US-Dollar pro Stunde zahlte und kam dafür in die Kritik (Ursprungsartikel der “Time” unter diesem Link [Englisch], Zusammenfassung auf Deutsch unter diesem Link). Für große Social-Media-Konzerne hingegen erledigen diese Arbeiten oft Angestellte unter schlechten Bedingungen auf den Philippinen, wie die Dokumentation “The Cleaners” eindrücklich zeigt:

(Bis August 2023 ist die Dokumentation noch in der ARD-Mediathek unter diesem Link abrufbar.)

Praxis-Idee zu KI & Diskriminierung

Mit unserer Praxis-Idee "Coded Bias - Wie KI diskriminiert" (Sek 2) kann mit Schüler:innen im Unterricht erarbeitet werden, wie sich Diskriminierung und Rassimus in Künstlicher Intelligenz fortschreiben.

Zurück

Name	Zweck	Ablauf	Typ	Anbieter
CookieConsent	Speichert Ihre Einwilligung zur Verwendung von Cookies.	1 Jahr	HTML	Web Consent
fe_typo_user	Ordnet Ihren Browser einer Session auf dem Server zu. Dies beeinflusst nur die Inhalte, die Sie sehen und wird von uns nicht ausgewertet oder weiterverarbeitet.	Session	HTTP	Web User

Name	Zweck	Ablauf	Typ	Anbieter
DSID	Google: Sicherheit, Funktionalität, Werbung für AdSense, Campaign Manager, Google Ad Manager, Google Analytics, Display + Video 360, Search Ads 360	2 Wochen	HTML	Google
test_cookie	Google: Funktionalität für AdSense, Campaign Manager, Google Ad Manager, Google Analytics, Display + Video 360, Search Ads 360	15 Minuten	HTML	Google
IDE	Google: Werbung for Campaign Manager, Display + Video 360, Google Ad Manager, Google Analytics, Search Ads 360	24 Monate	HTML	Google
FPLC	Google: Analytik für Google Analytics	20 Stunden	HTML	Google
FPID	Google: Analytik für Google Analytics	2 Jahre	HTML	Google
GA_OPT_OUT	Google: Funktionalität für Google Analytics	7 Jahre	HTML	Google
__utma	Google: Analytik für Google Analytics	2 Jahre	HTML	Google
__utmb	Google: Analytik für Google Analytics	30 Minuten	HTML	Google
__utmc	Google: Analytik für Google Analytics	Session	HTML	Google
__utmt	Google: Analytik für Google Analytics	10 Minuten	HTML	Google
__utmz	Google: Analytik für Google Analytics	6 Monate	HTML	Google
__utmv	Google: Analytik für Google Analytics	2 Jahre	HTML	Google
_ga	Wird verwendet, um Benutzer zu unterscheiden.	2 Jahre	HTML	Google
_gat	Wird zum Drosseln der Anfragerate verwendet.	1 Minute	HTML	Google
_gat_--custom-name--	Google: Analytik für Google Analytics	1 Minute	HTML	Google
_gid	Wird verwendet, um Benutzer zu unterscheiden.	24 Stunden	HTML	Google
_ga_--container-id--	Speichert den aktuellen Sessionstatus.	2 Jahre	HTML	Google
_dc_gtm_--property-id--	Wird von DoubleClick (Google Tag Manager) verwendet, um die Besucher nach Alter, Geschlecht oder Interessen zu identifizieren.	1 Minute	HTML	Google
_gaexp	Google: Analytik für Google Analytics, Optimize	93 Tage	HTML	Google
_gaexp_rc	Google: Analytik für Google Analytics, Optimize	10 Sekunden	HTML	Google
_opt_awcid	Google: Analytik für Google Analytics, Optimize	24 Stunden	HTML	Google
_opt_awmid	Google: Analytik für Google Analytics, Optimize	24 Stunden	HTML	Google
_opt_awgid	Google: Analytik für Google Analytics, Optimize	24 Stunden	HTML	Google
_opt_awkid	Google: Analytik für Google Analytics, Optimize	24 Stunden	HTML	Google
_opt_utmc	Google: Analytik für Google Analytics, Optimize	24 Stunden	HTML	Google
_gac_--property-id--	Enthält Informationen zu Kampagnen für den Benutzer. Wenn Sie Ihr Google Analytics- und Ihr Google Ads Konto verknüpft haben, werden Elemente zur Effizienzmessung dieses Cookie lesen, sofern Sie dies nicht deaktivieren.	90 Tage	HTML	Google
AMP_TOKEN	Enthält ein Token, das verwendet werden kann, um eine Client-ID vom AMP-Client-ID-Service abzurufen. Andere mögliche Werte zeigen Opt-out, Anfrage im Gange oder einen Fehler beim Abrufen einer Client-ID vom AMP Client ID Service an.	1 Jahr	HTML	Google

Name	Zweck	Ablauf	Typ	Anbieter
YouTube	Es wird eine Verbindung mit YouTube hergestellt, um Videos anzuzeigen.	keine	Verbindung	YouTube
GoogleMaps	Es wird eine Verbindung mit Google Maps hergestellt, um Karten anzuzeigen.	keine	Verbindung	Google
__cf_bm	Wird benötigt, um Vimeo-Inhalte zu sehen.	1 Jahr	HTTP	Vimeo
OptanonAlertBoxClosed	Speichert Ihre Zustimmung zum Vimeo-Datenschutz.	1 Jahr	HTML	Vimeo
OptanonConsent	Speichert Ihre Zustimmung zum Vimeo-Datenschutz.	1 Jahr	HTML	Vimeo
player	Dieses Cookie speichert Ihre Einstellungen, bevor Sie ein eingebettetes Vimeo-Video abspielen. Dadurch bekommen Sie beim nächsten Mal, wenn Sie ein Vimeo-Video ansehen, wieder Ihre bevorzugten Einstellungen.	1 Jahr	HTML	Vimeo
vuid	Dieses Cookie sammelt Informationen über Ihre Handlungen auf Webseiten, die ein Vimeo-Video eingebettet haben.	2 Jahre	HTML	Vimeo
_abexps	Dieses Vimeo-Cookie hilft Vimeo, sich an die von Ihnen getroffenen Einstellungen zu erinnern. Dabei kann es sich zum Beispiel um eine voreingestellte Sprache, um eine Region oder einen Benutzernamen handeln. Im Allgemeinen speichert das Cookie Daten darüber, wie Sie Vimeo verwenden.	1 Jahr	HTML	Vimeo
continuous_play_v3	Bei diesem Cookie handelt es sich um ein Erstanbieter-Cookie von Vimeo. Das Cookie sammelt Informationen wie Sie das Vimeo-Service verwenden. Beispielsweise speichert das Cookie, wann Sie ein Video pausieren bzw. wieder abspielen.	2 Jahre	HTML	Vimeo

KI "lobotomiert": Wenn Chatbots Hass im Netz streuen

Weitere Beiträge zum Thema