
Bild gesehen, das du nachstellen willst? Mach es mit einem Klick zum Prompt — ZOOOPs Stil-Analyse
Jeder, der schon mit einem KI-Bildgenerator gearbeitet hat, kennt diesen Moment: Du scrollst durch Pinterest oder das Portfolio einer Freundin, stößt auf ein Bild, dessen Licht, Palette und Stimmung genau das ist, was du willst — und zehn Minuten später starrst du immer noch auf ein leeres Prompt-Feld, ohne das in Worte fassen zu können.
ZOOOP hat dafür gerade eine kleine Abkürzung ausgeliefert — die Stil-Analyse: lade ein Referenzbild hoch, warte ein paar Sekunden, bekomm einen sauberen englischen Prompt zurück. Direkt ins Feld einfügen, oder vorher noch ein paar Formulierungen umschreiben.
Was die Stil-Analyse tatsächlich tut
In einem Satz: sie übersetzt ein Bild in einen Prompt, den das Modell lesen kann.
Sie zerlegt das Bild entlang einiger Achsen:
- Subject (Motiv) — was im Bild ist: Personen, Objekte, die Szene selbst
- Composition (Komposition) — Winkel, Abstand, Bildausschnitt, Aufbau
- Style (Stil) — Fotografie, Illustration, Ölmalerei, 3D-Rendering, Filmlook usw.
- Lighting (Licht) — hart oder weich, von vorn oder von hinten, warm oder kalt
- Palette (Palette) — dominante Töne, Farbbeziehungen, Sättigung
- Mood (Stimmung) — emotionaler Register: ruhig, angespannt, warm, einsam
Dann webt sie alles zu einem einzelnen englischen Absatz zusammen, gedeckelt auf rund 120 Wörter. Warum Englisch — heutige Bildmodelle sind immer noch deutlich präziser auf englische Prompts abgestimmt; auch gutes Deutsch verwässert im impliziten Übersetzungsschritt. Direkt in der Sprache zu liefern, in der das Modell trainiert wurde, macht die Ergebnisse spürbar stabiler.
Wie das Ergebnis aussieht
Die Achsen oben bleiben abstrakt, bis du sie an einem echten Bild siehst. Stell dir vor, du hast ein Foto hochgeladen, das beschreibt: „Dämmerung in Tokio, eine einsame Gestalt mit schwarzem Regenschirm läuft über eine nasse Straße, Neonreflexe in den Pfützen". Das strukturierte Ergebnis sieht ungefähr so aus:
- Subject — a lone figure with a black umbrella walking down a rain-slicked street
- Composition — low-angle shot, centered subject, leading lines from neon signs
- Style — cinematic photography, subtle film grain, anamorphic flare
- Lighting — rim lighting from neon, soft ambient fill, cool dominant with warm accents
- Palette — deep teal and magenta, warm amber highlights from puddles
- Mood — melancholic, contemplative, urban solitude
- Camera — 35mm anamorphic lens, shallow depth of field
Darunter steht eine Overall Description — dieselben Achsen, zu einem zusammenhängenden englischen Prompt verwoben. Dieser Absatz landet tatsächlich im Eingabefeld des Generators; die aufgeschlüsselten Achsen darüber sind eher die Begründung dafür, „warum der Prompt sagt, was er sagt", damit du einzelne Teile gezielt rauspicken und ändern kannst.
Der Vorteil dieser Darstellung: du kannst eine Achse nach der anderen festhalten. Komposition und Stimmung sollen bleiben, aber das Licht soll auf weiches Morgenlicht wechseln? Du änderst nur die Lighting-Zeile, tauschst den passenden Satz in der Overall Description und lässt alles andere stehen. Viel schneller, als alles neu zu schreiben.
Wo du sie findest
Die Stil-Analyse taucht innerhalb von ZOOOP an zwei Stellen auf:
- Oben über dem Prompt jedes Generators — öffne einen KI-Bildgenerator oder einen KI-Videogenerator, häng ein Referenzbild an, und oberhalb des Eingabefelds erscheint ein „Describe style"-Button.
- Innerhalb des Canvas — der generative Canvas hat denselben Button in seiner Prompt-Leiste. Praktisch für Multi-Shot-Workflows: ein Referenzbild analysieren, denselben Look über zehn Shots wiederverwenden.
Klick, ein paar Sekunden warten, das Prompt-Feld füllt sich von selbst. So abschicken — oder vorher noch eine Formulierung umschreiben. Startpunkt, nicht Ziellinie.
Wann du sie nutzen solltest (und wann nicht)
Gute Anwendungsfälle:
- Du hast eine Referenz gesehen, die du liebst, kannst aber nicht in Worte fassen warum — lass es die Analyse für dich sagen.
- Du willst einen konsistenten Look über eine Shot-Serie — die erste Referenz analysieren, dieselbe Beschreibung in alle anderen einsetzen.
- Du sitzt fest beim Promptschreiben und brauchst einen anderen Winkel, um den Knoten zu lösen.
- Du willst die Bildsprache eines Fotos oder Gemäldes auf ein neues Motiv übertragen — etwa die Stimmung eines Filmstills auf deine eigene Charakterszene.
Nicht das richtige Werkzeug für:
- Pixelgenaue Kopie. Die Stil-Analyse macht Stiltransfer, keine exakte Kopie. Wenn du ein bestehendes Bild punktgenau bearbeiten willst, nimm die KI-Bildbearbeitung.
- Bilder mit viel Text. Die Analyse transkribiert bewusst keinen Text aus dem Bild — Schilder, Plakate, Untertitel werden alle ignoriert. Das ist Absicht, um Lesefehler zu vermeiden.
- Konkrete, erkennbare Personen. Aus Datenschutzgründen werden keine Namen ausgegeben, nur beobachtbare Merkmale wie „eine Frau Mitte dreißig mit langen, glatten schwarzen Haaren".
Ein paar Gewohnheiten, die sich lohnen
Prompts zu schreiben ist ein bisschen wie Kochen — manche halten sich ans Rezept, andere schmecken ab. Die Analyse reicht dir das Rezept; wie wörtlich du es nimmst, entscheidest du.
Bearbeite, kleb nicht blind ein. Die Ausgabe ist eine zusammenhängende Beschreibung. Lies sie durch; was nicht passt, raus. Die Analyse schreibt vielleicht „at dusk", obwohl du „at dawn" wolltest — ein Wort ändern.
Für Kombinationen separat analysieren. Wenn du das Licht von Bild A und die Komposition von Bild B willst, lass sie nacheinander durch die Analyse laufen und füg die Sätze von Hand zusammen. Viel kontrollierbarer, als das Modell beide gleichzeitig anschauen zu lassen.
Übersetz das Englisch nicht zurück. Das Modell liefert am besten, wenn es direkt mit Englisch gefüttert wird — du musst nicht jedes Wort lesen. Schick es durch einen Übersetzer, um den Sinn zu checken, aber schreib es nicht in Deutsch um vor dem Abschicken.
Eine Anmerkung
Die Stil-Analyse kostet pro Lauf nur eine kleine Menge Credits — leicht genug, um sie unbeschwert zu nutzen — und erstattet bei Fehlschlag automatisch. Sie läuft auf derselben Infrastruktur wie der Rest der KI-Bildgenerierung und der KI-Videogenerierung, Tempo und Stabilität bewegen sich also auf dem Niveau der Hauptwerkzeuge.
Die ehrliche Variante: der Flaschenhals bei KI-Bildarbeit ist meistens nicht das Modell — sondern, dass „was ich eigentlich will" schwer laut auszusprechen ist. Genau bei diesem Schritt hilft die Stil-Analyse. Sie macht aus einem vagen Gefallen eine konkrete Beschreibung, und das Modell übernimmt den Rest.
Wenn du das nächste Mal an etwas vorbeiscrollst, dessen Wirkung du gern selbst hinbekommen würdest, hör auf, Worte zu suchen. Wirf es in den KI-Bildgenerator oder den generativen Canvas, drück den Button, schau was zurückkommt.