KI-Tipp: Bilder “nachprompten”

Ein Bild mittels KI nachstellen und dabei die sprachliche Ausdrucksfähigkeit trainieren.

Tipps
Ein Laptop vor türkisem Hintergrund. Am Bildschirm des Laptops ist ein fantasievolles Bild eines Stiefel-Hauses zu sehen.
Den Schüler:innen wird ein Bild als Vorlage gegeben. Sie versuchen dieses durch möglichst genaue Beschreibung "nachzuprompten".

Wie lassen sich Grundbestandteile von Künstlicher Intelligenz schnell und einfach erklären? Welche KI-Tools eignen sich besonders gut zum Einsatz im Unterricht oder zu dessen Vorbereitung? Diese Fragen stehen im Mittelpunkt unserer “KI-Tipp”-Reihe, bei der wir einzelne Anwendungen oder auch Anregungen für Prompts & Co. vorstellen.

Ein Bild “nachprompten”

KI-Bildgenerierung kann nicht nur für die Verwirklichung eigener Ideen genutzt werden, sondern auch, um vorhandene Bilder so genau wie möglich “nachzuprompten”. Dazu wird den Schüler:innen ein Bild gezeigt. Diese sehen sich das genau an und versuchen, es in einem beliebigen KI-Bildgenerator in Textform so genau wie möglich zu beschreiben. Folgende Angaben können zur genauen Bildbeschreibung hilfreich sein:

  • Hauptmotiv (Was ist zu sehen?)
  • Handlung/Pose (Was passiert?)
  • Umgebung/Hintergrund (Wo passiert es?)
  • Stil/Medium (fotorealistisch, Ölgemälde, Comic etc.)
  • Licht/Atmosphäre/Stimmung (düster, warme Farben, etc.)
  • Perspektive/Format (Quer-/Hochformat, Totale, Nahaufnahme etc.)

Je besser und detaillierter die Beschreibung, desto näher am Original ist das Ergebnis. Dabei ist vor allem die schriftliche Ausdrucksfähigkeit gefragt, aber auch rezeptive ästhetische Kompetenz und ein gewisses Maß an Verständnis für das Entstehen von Bildern bzw. Kunstwerken.

Beispiel:

Das obenstehende Bild diente als Vorlage für das Bild darunter, das mittels Google Gemini nachgepromptet wurde. Dazu wurde folgender Prompt formuliert:

Ein fotorealistisches Bild einer Fantasielandschaft im Querformat. Totale. Von unten ragt ein Hügel ins Bild, dieser ist bewachsen mit grünem Gras. In der Mitte des Bildes steht ein überdimensional großer, brauner Lederstiefel mit weißen, offenen Schnürsenkeln, die nicht bis zum obersten Loch durchgefädelt sind. An der rechten Seite des Schuhs ist eine kleine, grüne Tür angebracht. Eine kleine, hölzerne Treppe mit 4-5 Stufen und Geländer führt vom Grashügel zu der Tür. Etwas oberhalb der Tür sind grüne, geschlossene Fensterläden zu sehen. Noch ein Stück darüber ragt rechts vom Schuh ein langer, dünner, etwas krummer Schornstein aus dem Schuh, aus dem ein wenig Rauch aufsteigt. Dort, wo man sonst in den Schuh reinschlüpfen würde, ist ein Dachgeschoss zu sehen. Die Dachziegel sind kaminrot. Das Dachgeschoss hat einen hölzernen Balkon. Die Balkontür ist mit grünen Fensterläden verschlossen. Im Hintergrund des Bildes sind Nebelschwaden zu sehen, diese sind am Boden des Grashügels heller und werden nach oben hin dunkler ins lila-blau gehende. Von links ragt im Hintergrund ein steinerner Berg ins Bild, der etwa auf Höhe des Schuhes endet. Der Schuh in der Mitte im Vordergrund des Bildes ist etwa gleich hoch, wie der Berg im Hintergrund des Bildes.

Je fantasievoller oder abstrakter ein Bild ist, desto herausfordernder ist auch dessen Beschreibung. Haben alle Schüler:innen dasselbe Bild nachgepromptet, können die Ergebnisse anschließend verglichen und diskutiert werden: Welche Bilder sind näher am Original und warum? Was ist nötig, um ein möglichst gutes Ergebnis zu erzielen? Welche Angaben und Begriffe in den Prompts waren vermutlich besonders hilfreich? Auch die Frage des Urheberrechts kann anlässlich dessen reflektiert werden: Wem gebührt die Anerkennung für so ein Bild – dem/der Urheber:in des Originalbilds, der KI oder dem/der Prompter:in? (Mehr Infos zu diesem Thema sind in unserem Artikel “Künstliche Intelligenz und Urheberrecht” zu finden.)


Tipp: KI-Bildgeneratoren

Grundsätzlich kann für diese Übung jeder beliebige KI-Bildgenerator genutzt werden. Dabei sollte jedoch beachtet werden, dass KI-Bildgeneratoren in der Regel eine Registrierung erfordern und in den kostenlosen Varianten oft stark eingeschränkt sind, z.B. was die Anzahl der täglichen Bildgenerierungen betrifft. Der Bing Image Creator hat auch in der kostenlosen Variante ein besonders großzügiges Limit, beschränkt dafür jedoch die maximale Zeichenanzahl pro Prompt auf maximal 480 Zeichen, was besonders detaillierte Bildbeschreibungen eventuell einschränken könnte. 

Praxis-Idee: KI und Kunst

Weitere Ideen und Anregungen für den Unterricht zum Thema KI und Kunst finden Sie in unserer Praxis-Idee KI und Kunst: Wie Bilder durch Künstliche Intelligenz entstehen.