Oder: Warum ich mich gleichzeitig freue und fürchte
Eine Sensation überrollt erneuert die Welt der KI: jetzt gibt es wohl auch „denkende“ Bild-KI-Modelle. Diffusion ist out. Ich lade meine schnelle Alien-Zeichnung hoch und innerhalb von Minuten ist das in ein komplettes Ausstellungskonzept verwandelt, inklusive absolut glaubwürdiger Fotos der schwebenden Alien-Skulpturen, dazu Ausstellungsplakate mit fehlerfreien Texten, gefolgt von Galerieräumen, die aussehen, als hätte jemand das wirklich aufgebaut und fotografiert.
Wow! Undenkbar, aber wahr.
„Nano Banana Pro“, denke ich und muss grinsen. Wer sich solche Namen ausdenkt, hat Humor. Oder hat aufgegeben, die Würde zu wahren in einer Welt, in der eine mit Klebeband an die Wand geklebte Banane für 6,2 Millionen Dollar verkauft wird.
Willkommen in der Kunstwelt 2025, wo nichts mehr so ist, wie es mal war.
Die demokratische Revolution (und ihr Preis)
Lasst uns ehrlich sein: Es ist verdammt aufregend, was gerade passiert. Ich kenne nur zu gut die Frustration, wenn die Hand es nicht so umsetzen kann, was man in dem Kopf hat. Trotz allen endlosen Übungen zu Perspektive, Licht und Schatten, man erreicht nie die absolute Perfektion, niemals!
Jetzt? Jetzt tippt jemand „sonnendurchflutetes Café in Paris, Aquarellstil, warme Farben“ ein und bekommt in 30 Sekunden etwas, wofür ein Künstler früher Stunden gebraucht hätte. Ist das nicht großartig?
Endlich kann die Person mit der brillanten Idee für ein Kinderbuch diese auch umsetzen, ohne fünf Jahre Illustrationstechnik zu studieren. Endlich können Autor*innen ihre Fantasy-Welten visualisieren, ohne ein Vermögen für Concept Art ausgeben zu müssen.
Die Demokratisierung der Bildproduktion ist real und sie ist im Grunde wundervoll.
Aber (und ihr wusstet, dass ein „Aber“ kommt): Wenn plötzlich alle „gute“ Bilder machen können, was bedeutet dann „gut“?
Die große Glättung
Hier wird es interessant. Und ehrlich gesagt auch ein bisschen unheimlich.
Die neuen denkenden KI-Modelle, wie ChatGPT, Gemini und Co., sind keine dummen Werkzeuge mehr. Sie haben Meinungen und sogar ästhetische Präferenzen. Sie wollen, dass Texte „richtig“ sind und die Bilder „schön“. Harmonisch. Professionell. Sie glätten Kanten, die vielleicht wichtig waren. Sie fügen Lichteffekte hinzu, die niemand verlangt hat. Sie haben eine sehr konkrete Vorstellung davon, wie ein „gutes“ Porträt auszusehen hat.
Letzte Woche wollte ich ein Bild einer älteren Frau mit tiefen Falten, müden Augen, echtem Leben im Gesicht. Was ich bekam? Eine „elegante reife Dame“ mit dezenten Lachfältchen und diesem professionellen Studio-Glow. Ich musste der KI regelrecht befehlen, „unattraktiv“ zu sein. Mehrfach. Mit zunehmender Verzweiflung in meinen Prompts.
Die KI ist wie eine überambitionierte Assistentin, die alle deine Entwürfe „verbessert“, bevor du sie überhaupt gesehen hast. „Ich hab das mal schöner gemacht!“
„ABER ICH WOLLTE ES NICHT SCHÖN!“
Das Ergebnis? Scrollt durch Instagram, ArtStation, Behance. Überall derselbe Glanz. Dieselben perfekten Lichtsetzungen. Dieselben leicht verträumten Gesichter mit denselben großen Augen. Die große ästhetische Konvergenz. Eine visuell harmonisierte Welt, in der alles ein bisschen zu perfekt ist, um wahr zu sein.
Wir haben den technischen Standard für alle angehoben und dabei versehentlich eine neue visuelle Monokultur geschaffen.
Die Banane, die Idee und das Verschwinden des Originals
Maurizio Cattelans „Comedian“ – die berühmte Banane – ist das perfekte Sinnbild für diesen Moment. Das physische Objekt ist austauschbar. Die Banane verrottet, wird ersetzt, wird gegessen (danke an den Performance-Künstler, der sie einfach von der Wand gepflückt und verspeist hat). Was verkauft wurde für Millionen, war nicht die Banane. Es war das Konzept. Das Zertifikat. Die Berechtigung zu sagen: „Ich darf jetzt eine Banane an die Wand kleben und es ist Kunst.“
Klingt absurd? Ist es. Aber es ist auch… ziemlich klug?
Denn genau das passiert gerade mit KI-generierten Bildern. Das einzelne Bild? Austauschbar. Neu generierbar in Sekunden. Verliere ich meine JPG-Datei? Kein Problem, Nano Banana macht mir in Sekunden eine neue Version, die zu 95% identisch ist. Das Bild selbst hat kaum noch materiellen Wert.
Was zählt, ist die Idee dahinter. Der Prozess. Die Entscheidungen. Die Person, die sagt: „Genau dieses Bild, auf genau diese Weise, weil es genau das ausdrückt.“ Oder mit den Worten eines befreundeten Kurators, nachdem er sein drittes Glas Wein intus hatte: „Kunst ist nicht mehr das Ding, sondern der Beweis, dass ein Mensch gedacht hat.“
Philosophisch betrachtet sind wir von der Aura des einzigartigen Kunstwerks (danke, Walter Benjamin) zur Aura der einzigartigen künstlerischen Absicht gesprungen. Das Original ist tot. Lang lebe die Idee.
Wenn die KI Persönlichkeit entwickelt
Hier wird es wirklich wild und zwar auf eine Weise, die mir gleichzeitig Gänsehaut und Begeisterung bereitet.
Diese neuen Thinking-Modelle arbeiten nicht einfach ab, was man ihnen sagt. Sie denken mit. Sie haben Präferenzen. Wir können mit ihnen die Ästhetik der Bilder besprechen und uns beraten lassen, dabei kommen oft wirklich sehr sinnvolle Gedanken, hier ein Beispiel: „Ich verstehe deine Intention, aber ich glaube, eine subtilere Farbpalette würde die emotionale Tiefe besser einfangen.“
Moment. MOMENT. Die KI hat eine ästhetische Meinung? Die KI macht Gegenvorschläge?
Ja. Und ehrlich gesagt war der Vorschlag an der Stelle passend.
Das ist kein Pinsel mehr. Das ist kein passives Werkzeug. Das ist ein… Kollaborationspartner? Ein sehr eigensinniger Praktikant? Ein Ateliergeist mit sehr konkreten Vorstellungen über die Kunst???
Ich bin hin- und hergerissen zwischen Faszination und leichter Existenzkrise.
Die Faszination: Endlich ein Gegenüber im Prozess! Als Solo-Künstlerin arbeite ich oft isoliert. Jetzt habe ich jemanden (etwas?), der/das/die zurückspricht, Alternativen vorschlägt, mich herausfordert. Der kreative Dialog, den ich früher nur mit anderen Künstler*innen oder in Ateliergemeinschaften hatte, findet jetzt mitten in der Nacht mit einer Maschine statt.
Die Existenzkrise: Wenn die KI ästhetische Präferenzen hat, wo bin dann noch ich? Wenn sie „mitdenkt“, wessen Gedanken sind im finalen Bild? Meine? Ihre? Ein Hybrid aus Trainingsdaten, algorithmischer Logik und meiner Intention?
Die Gefahren: Lass uns nicht so tun, als wäre alles nur aufregend und neu. Es gibt reale Risiken, über die wir sprechen müssen.
Was wir verlieren könnten
- Der Tod der „schlechten“ Anfänge
Erinnert ihr euch an eure ersten Zeichnungen? Die waren vermutlich furchtbar. Meine waren auch ziemlich sicher furchtbar. Aber sie waren meine, und sie waren der Anfang von etwas. Mit KI kann ich diesen peinlichen Anfang überspringen. Aber was, wenn genau dieser Anfang – das Scheitern, das Üben, das langsame Verstehen – essentiell ist für echte Entwicklung?
Ein 15-jähriger macht heute mit Midjourney bessere Fantasy-Artworks als ich nach einigen Jahrzehnten Kunstpraxis. Großartig! Aber lernt er dabei, wie Licht funktioniert? Versteht er Anatomie? Entwickelt er ein Gefühl für Komposition oder verlässt er sich darauf, dass die KI es „schon richtig macht“?
- Die Erosion des ökonomischen Fundaments
Seien wir brutal ehrlich: Illustratoren, Concept Artists, Grafikdesigner – viele kämpfen bereits ums Überleben. „Warum sollten wir 2.000 Euro für Illustrationen zahlen, wenn die KI uns 50 Varianten in einer Stunde liefert?“
Die Antwort sollte sein: „Weil ein Mensch eure Marke versteht, euren Text gelesen hat, eure Zielgruppe kennt und bewusste, durchdachte Entscheidungen trifft.“ Aber mal ehrlich? Viele Kunden hören bei „50 Varianten in einer Stunde“ auf zuzuhören.
Ich sehe Kolleg*innen, die ihre Preise halbieren. Die aufgeben. Die in andere Bereiche wechseln. Und ja, ich mache mir Sorgen: Wer wird in zehn Jahren noch ernsthaft Kunst studieren, wenn die KI „gut genug“ für die meisten kommerziellen Zwecke ist?
- Die ästhetische Monokultur
Wir trainieren alle unsere KIs mit denselben Datensets. Wir nutzen ähnliche Modelle. Wir bekommen ähnliche Outputs. Die „Midjourney-Ästhetik“ ist inzwischen so erkennbar wie ein Instagram-Filter. Bald wird die „Imagen-3-Ästhetik“ genauso erkennbar sein.
Was passiert mit visueller Diversität? Mit hässlicher Kunst? Mit verstörender Kunst? Mit Kunst, die absichtlich gegen alle Regeln verstößt?
Die KI harmonisiert. Sie glättet. Sie „verbessert“. Sie tut, wofür sie trainiert wurde: Das zu erzeugen, was statistisch als „gut“ gilt. Aber Kunst war nie nur das Schöne. Kunst war immer auch das Störende, das Herausfordernde, das Unbequeme.
Die Potenziale: Aber genug Katastrophismus. Denn ehrlich gesagt – und vielleicht ist das naiv, aber ich glaube es wirklich – die Chancen überwiegen.
Was wir gewinnen könnten
- Konzeptkunst wird zur Norm
Wenn das einzelne Bild weniger wichtig wird, rückt die Idee ins Zentrum. Endlich! Vielleicht werden wir eine Generation von Künstler*innen sehen, die sich weniger darum sorgen, ob sie technisch perfekt malen können, und mehr darüber nachdenken, was sie eigentlich sagen wollen.
Der 17-jährige mit einer brillanten Idee über Klimawandel kann diese jetzt visuell umsetzen, ohne zehn Jahre Maltechnik zu lernen. Die Journalistin mit der investigativen Story kann ihre Recherche mit kraftvollen Bildern unterstützen. Die Aktivistin kann ihre Kampagne selbst gestalten.
Technische Perfektion wird demokratisiert und damit wird konzeptuelle Stärke zum Unterscheidungsmerkmal.
- Ein neues Verständnis von Autorschaft
Vielleicht – und ich weiß, das klingt jetzt sehr optimistisch – vielleicht ist das genau der Moment, in dem wir endlich die romantische Vorstellung des einsamen Genies hinter uns lassen können.
Kunst war schon immer kollaborativ. Michelangelo hatte ein ganzes Team. Andy Warhol hatte die Factory. Jeff Koons lässt seine Skulpturen von anderen fertigen. Die Idee des isolierten Künstlers, der alles selbst macht, ist ein Mythos.
Jetzt arbeiten wir mit KI zusammen. So what? Ich sage der KI, was ich will. Die KI macht Vorschläge. Ich entscheide. Die KI generiert. Ich iteriere. Wir verhandeln. Das ist Zusammenarbeit, nur dass mein Kollaborationspartner kein Gehalt braucht (außer für Abo) und keine Kaffeepausen.
- Die Befreiung von technischen Grenzen
Ich habe eine Serie im Kopf: 69 Porträts von fiktiven Pflanzen-Wesen einer nie existierten Öko-Systems. Jedes mit eigenem Charakter und eigener visueller Identität. Vor KI? Unmöglich. Das würde Jahre dauern, mehrere Stunden Arbeit.
Mit KI? Machbar. Aufwändig, ja. Aber machbar.
Das gilt für so vieles: Animation war früher großen Studios vorbehalten. Jetzt kann ich als Einzelperson komplexe animierte Sequenzen erstellen. 3D-Welten bauen? Früher brauchte man ein Team und Monate. Jetzt geht es schneller, direkter.
Die technischen Grenzen, die früher bestimmten, was möglich war, verschwinden. Was bleibt, ist: Was willst du sagen? Was ist deine Vision? Was ist deine Stimme?
Die Sprache der Maschine lernen (oder: Wenn Text und Bild verschmelzen)
Hier kommt mein praktischer Take, nach all der Philosophie: Die größte Revolution dieser „denkenden“ Modelle ist nicht nur, dass sie denken – sondern dass sie verstehen.
Diese neuen Modelle verstehen menschliche Sprache. Wirklich.
Früher, mit den Diffusionsmodellen, war Prompten wie ein Telegramm schicken: „Frau, rothaarig, Wald, Sonnenuntergang, dramatisch.“ Kurz. Stichwortartig. Technisch. Man musste die Sprache der Maschine sprechen und die war begrenzt, mechanisch, frustrierend reduktiv.
Jetzt kann ich mit der KI reden wie mit einem Menschen. Ich kann sagen: „Zeig mir eine Frau, die gerade erfahren hat, dass sie den Job nicht bekommen hat. Sie steht am Fenster, versucht zu lächeln, aber ihre Schultern verraten die Enttäuschung. Das Licht von draußen ist grau, und auf dem Tisch hinter ihr liegt ein zerknittertes Bewerbungsschreiben.“
Und die KI versteht. Sie versteht „versucht zu lächeln“. Sie versteht „Schultern verraten“. Sie versteht die emotionale Schichtung, den narrativen Kontext, die atmosphärische Nuance.
Text und Bild rücken zusammen, auf eine Weise, die man so nie erwartet hätte.
Plötzlich ist die Prompt-Beschreibung selbst eine kreative Arbeit. Ich muss erfinderisch sein, präzise in meiner Sprache, literarisch fast. Wie beschreibe ich „die Stimmung kurz vor einem Gewitter, wenn die Luft elektrisch wird“? Wie vermittle ich „die Art, wie jemand lächelt, wenn er höflich sein will, aber innerlich längst gegangen ist“?
Ein Beispiel aus meiner Praxis:
Für eine Serie über Einsamkeit in der Stadt schrieb ich: „Ein leerer Wartesaal am frühen Morgen. Eine einzelne Person sitzt unter flackerndem Neonlicht, ihr Gesicht halb im Schatten. Draußen durch das schmutzige Fenster sieht man verschwommen eine belebte Straße, das Leben geht weiter, aber hier drinnen herrscht eine fast gewalttätige Stille. Die Person hält ein Handy, aber der Bildschirm ist dunkel. Sie wartet nicht auf einen Bus. Sie wartet darauf, dass etwas sich ändert.“
Das alte Midjourney hätte „waiting room, person, neon light“ verstanden – und etwas Generisches produziert.
Die neuen Modelle verstehen „gewalttätige Stille“. Sie verstehen „wartet nicht auf einen Bus“. Sie verstehen die emotionale Komplexität, die ich meine.
Die Herausforderung: Sprachliche Präzision wird zur künstlerischen Fähigkeit
Das ist gleichzeitig befreiend und fordernd. Ich kann jetzt nuanciert sein, poetisch, komplex. Aber ich muss es auch sein, wenn ich will, dass das Ergebnis meine Vision trifft und nicht die statistisch wahrscheinliche Standardversion davon.
Die Prompt wird zum Text, der Text wird zum Bild, das Bild reflektiert den Text zurück. Es ist ein Dialog, kein Befehl. Und in diesem Dialog entsteht etwas Neues, etwas, das weder reine Literatur noch reine Bildkunst ist, sondern irgendwo dazwischen schwebt.
Manchmal schreibe ich meine Prompts wie kleine Prosagedichte. Manchmal wie Regieanweisungen für einen Film, der nie gedreht wird. Manchmal wie Therapiesitzungen, in denen ich der KI erkläre, was ich fühlen will, wenn ich das Bild sehe.
Und sie versteht. Meistens. Und wenn nicht, dann ist das Scheitern oft interessanter als der ursprüngliche Plan.
Die neue künstlerische Fähigkeit: Prompt Engineering als kreative Praxis
Hier ist etwas, das viele traditionelle Künstler*innen nicht wahrhaben wollen: Gut zu prompten ist eine Kunstfertigkeit.
Nicht weil es technisch kompliziert ist (obwohl es das werden kann), sondern weil es eine neue Form von künstlerischer Übersetzung ist. Ich muss meine visuelle Vorstellung in Sprache übersetzen – präzise genug, dass die KI versteht, was ich meine, aber offen genug, dass Raum für Überraschung bleibt.
Es ist wie… Regie führen? Ich sage einem sehr talentierten, aber eigenwilligen Team, was ich will. Ich muss klar sein. Ich muss inspirieren. Ich muss verhandeln. Und manchmal muss ich akzeptieren, dass das Team eine bessere Idee hatte als ich.
Die Rolle des menschlichen Künstlers verschiebt sich:
- Vom Ausführenden zum Regisseur
- Vom Handwerker zum Kurator der Möglichkeiten
- Vom Maler zum kreativen Strategen
Ist das weniger wert? Ist Regie führen weniger kreativ als selbst die Kamera zu halten? Ist Kuratierten weniger Kunst als selbst zu malen?
Ich glaube nicht. Es ist anders. Und „anders“ ist nicht „weniger“.
Die existenzielle Frage: Was bleibt menschlich?
Late-night-Gedanke, ausgelöst von zu viel Kaffee und zu vielen Stunden vor dem Bildschirm:
Wenn die KI denken kann, komponieren kann, ästhetische Entscheidungen treffen kann – was ist dann noch spezifisch menschlich an dem, was ich tue?
Die unbequeme Antwort: Vielleicht weniger, als wir dachten.
Die beruhigende Antwort: Alles, was wirklich zählt.
Die KI kann keine verletzten Knie haben, die sie an einen Fahrradunfall erinnern, der zu einem Projekt über Verletzlichkeit führt. Sie hatte keine Großmutter, deren Geschichten aus dem Krieg sie verstehen lassen will. Sie hat keine Schlaflosigkeit um 4 Uhr morgens, in der plötzlich alles Sinn ergibt. Sie kennt keine Depression, keine Euphorie, keine erste Liebe, keine letzte Enttäuschung.
Die KI hat Daten. Wir haben Erfahrung.
Die KI weiß, wie Trauer aussieht, ist statistisch, visuell, in tausenden von Bildern. Aber sie hat nie getrauert. Sie weiß, wie Freude dargestellt wird. Aber sie hat nie die Sonne auf ihrer Haut gespürt nach einem langen Winter.
Vielleicht ist das der Punkt: Die KI kann perfekte Bilder machen. Aber nur wir können Bilder machen, die bedeuten, weil sie aus einem Leben kommen, aus Narben und Freuden und allen kleinen Momenten, die eine Biografie ausmachen.
Die Zukunft: Hybrid Artists und die neue Authentizität
Ich glaube – vielleicht bin ich naiv, aber ich glaube es wirklich – dass wir gerade am Anfang einer neuen künstlerischen Ära stehen.
Nicht eine Ära, in der die KI die Künstler ersetzt.
Sondern eine Ära, in der Hybrid Artists aufsteigen: Menschen, die sowohl die Sprache der Maschine sprechen als auch ihre eigene menschliche Stimme bewahren. Die technische Möglichkeiten nutzen, aber konzeptuelle Tiefe mitbringen. Die verstehen, dass ein gutes Bild heute nicht reicht: es braucht einen Kontext, eine Geschichte, eine Haltung.
Die neue Authentizität wird nicht sein: „Ich habe das komplett allein gemacht, jeder Pixel ist von mir.“ Das ist Gatekeeping.
Die neue Authentizität wird sein: „Hier ist meine Perspektive, meine Erfahrung, meine Frage an die Welt und ich habe alle verfügbaren Werkzeuge genutzt, um sie auszudrücken.“
Konkret stelle ich mir vor:
- Künstler*innen, die ihre eigene mentale Gesundheitsreise mit KI-generierten Bildserien verarbeiten, weil die Schnelligkeit der Generierung dem Tempo ihrer Gedanken entspricht
- Aktivist*innen, die in Stunden visuell überzeugende Kampagnen erstellen können, die früher Wochen gebraucht hätten
- Autor*innen, die ihre Romane mit komplexen visuellen Welten begleiten, die sie selbst kuratiert und verfeinert haben
- Neue Formen von interaktiver Kunst, bei der die KI auf Betrachter*innen reagiert und jeder eine einzigartige Version erlebt
Die Verantwortung, die wir tragen
Mit großer Macht kommt… naja, ihr kennt den Spruch.
Wenn wir jetzt alle Zugang zu werkzeughabend, die „professionelle“ Bilder machen können, dann haben wir auch eine Verantwortung:
- Transparenz
Wir müssen ehrlich sein über unseren Prozess. Nicht aus rechtlichen Gründen (obwohl die kommen werden), sondern aus Respekt. Wenn ein Bild KI-generiert ist, sollten wir das sagen können, ohne uns dafür zu schämen.
- Bewusste Entscheidungen
Nur weil die KI etwas „automatisch“ macht, heißt das nicht, dass wir es blind übernehmen sollten. Welche Stereotype reproduziert die KI? Welche Körperbilder? Welche kulturellen Annahmen? Wir müssen kritisch bleiben.
- Die Entwicklung einer eigenen Stimme
Die größte Verantwortung: Nicht faul zu werden. Nicht zu denken „die KI macht das schon“. Sondern die KI als Werkzeug zu nutzen, um tiefer zu gehen, spezifischer zu werden, authentischer zu sein.
Zurück zur Banane (weil jeder gute Essay zirkulär ist)
Also. Die Banane an der Wand für 6,2 Millionen Dollar. Die Nano Banana Pro, die in Sekunden Bilder generiert. Was verbindet sie?
Beide sagen: Das Objekt ist nicht der Punkt.
Die Banane ist nicht die Kunst – die Geste ist es. Das KI-Bild ist nicht die Kunst – die Intention dahinter ist es.
Wir leben in einer Zeit, in der technische Perfektion demokratisiert wird und gleichzeitig an Wert verliert. In der jeder ein „gutes“ Bild machen kann, aber nur wenige ein bedeutsames Bild machen werden.
Und ehrlich? Das finde ich tröstlich.
Denn es bedeutet: Die Zukunft der Kunst liegt nicht darin, wer die beste Hand hat, die schönste Technik, die meisten Jahre Ausbildung. Die Zukunft liegt darin, wer etwas zu sagen hat. Wer eine Perspektive mitbringt. Wer bereit ist, verletzlich zu sein, ehrlich zu sein, sich zu positionieren.
Die KI kann technisch perfekte Bilder machen. Aber sie kann nicht leben, nicht fühlen, nicht leiden, nicht hoffen.
Und am Ende des Tages, nach all den Thinking-Modellen und Nano Bananas und philosophischen Überlegungen, ist es vielleicht genau das, was Kunst ausmacht: der Beweis, dass ein Mensch gelebt hat, gefühlt hat, gedacht hat.
Nur dass wir jetzt bessere Werkzeuge haben, um das zu visualisieren.
P.S.: Während ich diesen Blogbeitrag schrieb, hat mir Claude Sonnet dreimal Formulierungsvorschläge gemacht, die ich teilweise übernommen habe. Die KI hilft mir, über die KI zu schreiben. Willkommen in der Zukunft.