Der Mythos vom „einen Prompt"
Die Demos von Sora, Veo 3 oder Kling 2.0 wirken, als würde ein Satz Text genügen, um einen Werbespot zu erzeugen. Im Marketing-Meeting entsteht daraus der Eindruck, der Job sei jetzt eine Textaufgabe. In der Praxis ist genau das Gegenteil der Fall: weil das Modell jedes Bild generieren kann, wird die Bildregie davor und der Schnitt danach noch wichtiger als in der klassischen Filmproduktion. Sonst entsteht beliebige, austauschbare Bewegtbild-Tapete.
Die sechs Disziplinen, die kein Prompt leistet
Ein Video mit messbarer Wirkung entsteht aus sechs kreativen Schritten. Das Modell ist nur an einer einzigen Stelle beteiligt — beim Render. Alles davor und danach ist klassisches Filmhandwerk.
1. Idee aus Markenstrategie
Welche Wahrheit über das Produkt, die Marke oder den Kunden wollen wir erzählen? Welche Emotion soll bleiben? Eine KI hat keinen Zugang zu Ihrer Positionierung, Ihren Wettbewerbern oder dem Marketing-Plan des Quartals. Eine Idee ohne diesen Kontext wird nett — aber irrelevant.
2. Konzept & Drehbuch
Welche Handlung, welcher Spannungsbogen, welcher Schluss? Welcher Ton? Welches Tempo? Das Drehbuch entscheidet, ob ein 30-Sek.-Spot den Zuschauer trägt oder nach 4 Sekunden weitergescrollt wird.
3. Storyboard & Szenenbild
Jede Einstellung wird als Frame entworfen — Komposition, Licht, Kamerawinkel, Bewegungsrichtung. In der KI-Produktion ist das Storyboard die wichtigste Disziplin überhaupt: jedes Panel wird später zum Image-to-Video-Startframe. Das Modell rendert genau das, was auf dem Storyboard steht — also entscheidet das Storyboard über das fertige Bild. Mehr zum Konzept-Vorlauf im Artikel Erklärvideo erstellen lassen.
4. Konsistenz-Pipeline
Ohne LoRA, Reference-Image-Conditioning und manuelles Comping sieht jeder Schnitt aus wie ein neues Modell. Personen ändern ihr Gesicht, Produkte ihre Form, Räume ihre Farbe. Markenbildung wird unmöglich. Die Konsistenz-Pipeline aufzubauen ist 30–50 % des Agentur-Aufwands — und der Grund, warum DIY-Videos „irgendwie KI" aussehen, statt nach Marke.
5. Schnitt, Sound & Color
Rhythmus, Cut-Logik, Sound-Design, Color-Grading: mindestens 30 % der wahrgenommenen Qualität entstehen hier. DaVinci Resolve, After Effects, Pro Tools — das Toolset und Können dahinter hat sich seit Jahrzehnten nicht geändert, KI ersetzt es nicht.
6. Finalisierung & Compliance
4K-Upscaling, Aspect-Ratio-Master für jedes Format, EU-AI-Act- konforme C2PA-Kennzeichnung, AVV-konforme Datenhaltung. In der DIY-Produktion meist vergessen — und ab August 2026 ein rechtliches Risiko.
Wann DIY trotzdem die richtige Wahl ist
- Mood-Tests und Stilrichtungs-Findung — Hauptsache schnell, Qualität zweitrangig.
- Interne Demos und Pitch-Decks — Publikum kennt Kontext.
- Social-Posts ohne Performance-Ziel — Volumen vor Wirkung.
- Storyboard-Animatic — Seedance erzeugt schnelle Timing-Tests.
Wann die Agentur sich immer lohnt
- Hero-Video auf der Startseite — trägt 40–60 % der Markenwahrnehmung.
- Werbespots auf Meta, LinkedIn, YouTube — CTR-Lücke zu DIY ist real und messbar (siehe KI-Werbevideo).
- Imagefilm / Brand Story — cineastische Bildsprache als Markenzeichen.
- Produkt-Launch & Industrievideo — Konsistenz von CAD zu Bewegtbild (siehe KI-Produktvideo Industrie).
- Messe-LED-Wand & Loops — 4K, nahtlos, kontrolliert (siehe KI-Messevideo).
- Erklärvideo mit Wissenstransfer — Dramaturgie und Storyboard entscheiden über Verständnis (siehe KI-Erklärvideo).
Der Kostenvergleich, der ehrlich rechnet
Tool-Abos sind nicht die echten Kosten. Wer die interne Zeit von Marketing-Manager:innen, Designer:innen und Geschäftsführung mit realistischen Stundensätzen ansetzt, landet für einen 30-Sekunden-Spot in DIY-Eigenproduktion typischerweise bei 5.000–14.000 € — auf Qualitätsniveau „besser als nichts". Eine Agentur liefert für 4.500–12.000 € ein Spot mit messbarem Impact, finalen Formaten, Compliance und 2–4 Iterationsrunden. Wer ehrlich rechnet, wählt die Agentur. Detaillierte Aufschlüsselung im KI-Video Kosten-Artikel.
Hybrid-Modell: das Beste aus beiden Welten
Das produktivste Setup 2026: Agentur baut einmalig das Fundament (Visual Language, LoRA-Brand-Pipeline, Storyboard-Templates, Prompt-Bibliothek). Das Marketing-Team produziert anschließend Varianten in Eigenregie — auf Brand. Wir nennen das „Brand OS für KI-Video". Mehr im Pillar-Guide KI-Video und im Glossar.
Tool-Empfehlungen, wenn Sie es trotzdem selbst probieren
- Für Hero-Look: Veo 3 (cineastisch, nativer Ton) — Setup-Hilfe im Vergleich Veo vs. Kling vs. Runway.
- Für Volumen: Seedance (günstig, schnell) — siehe Seedance vs. Veo vs. Kling.
- Für Editor-Workflow: Runway Gen-4 (Style-Refs, Motion-Brush).
- Realistisch einplanen: 40–120 Stunden Lernkurve, bevor brauchbare Ergebnisse entstehen.
Wenn Sie unsicher sind, ob Ihr nächstes Vorhaben in DIY oder Agentur gehört: kurze Beschreibung an uns, wir geben eine ehrliche Einschätzung zurück — auch dann, wenn die ehrliche Antwort „machen Sie das selbst" lautet. Direkt über das Kontaktformular oder telefonisch.