Ein Workflow für KI-gestütztes Coding, der tatsächlich funktioniert

Von hyretic Aktualisiert:

Dieser Beitrag fasst den Workshop “Full Walkthrough: Workflow for AI Coding” von Matt Pocock zusammen. Das vollständige Video findest du hier:

Matt Pocock ist vielen TypeScript-Entwicklern durch seine Tutorials und Open-Source-Projekte bekannt. In diesem Workshop zeigt er seinen kompletten Arbeitsprozess für KI-gestütztes Coding. Nicht als theoretisches Konzept, sondern als konkreten, praxiserprobten Workflow. Sein strukturierter Ansatz ersetzt das chaotische Vibe-Coding ohne feste Architekturstrukturen durch einen klaren Prozess.

Ich empfehle jedem Entwickler, der ernsthaft mit KI-Agenten arbeitet, dieses Video vollständig anzuschauen. Es ist einer der besten praxisnahen Beiträge zu diesem Thema.

Executive Summary (TL;DR)

  • Die Smart Zone: KI-Agenten arbeiten nur in den ersten ~100.000 Token effizient. Danach sinkt die Qualität drastisch (“Dumb Zone”).
  • Zwei-Phasen-Modell: Der Workflow trennt menschliche Architektur-Planung (“Day Shift”) strikt von der KI-Ausführung (“Night Shift”).
  • TDD als Leitplanke: Der KI-Agent schreibt Code ausschließlich nach dem iterativen Red-Green-Refactor-Prinzip.
  • Wiederverwendbare Skills: Fehler des Agenten werden nicht einmalig korrigiert, sondern als systematischer Prompt-Skill für die Zukunft abstrahiert.

Das Grundproblem: Die Smart Zone

KI-Modelle haben einen optimalen Leistungsbereich. Matt Pocock nennt ihn die “Smart Zone”. Sie umfasst ungefähr die ersten 100.000 Token einer Konversation.

Danach wird es problematisch: Je länger eine Sitzung läuft, desto mehr “Sediment” sammelt sich an. Alte Kontexte, verworfene Ansätze, überholte Anweisungen. Das Modell verliert den Fokus und produziert zunehmend fehlerhafte Ergebnisse. Es rutscht in die “Dumb Zone”.

Viele Entwickler versuchen dies zu umgehen, indem sie den Kontext innerhalb der Sitzung künstlich “komprimieren” (Compacting). Matt Pocock lehnt das ab und bevorzugt die “Memento”-Strategie: Das LLM sollte arbeiten wie der Protagonist aus dem Film Memento – es vergisst nach einer Aufgabe alles.

Die Konsequenz ist einfach: Halte Sitzungen kurz und fokussiert. Gib dem Agenten nur den relevanten Kontext für die exakte Aufgabe. Lass ihn implementieren, testen und committen. Dann leere den Kontext komplett (“Clear and go back to the beginning”) und starte frisch für die nächste Aufgabe.

Der Zwei-Phasen-Prozess

Pococks Workflow teilt die Arbeit in zwei klar getrennte Phasen: Die “Day Shift” für den Menschen und die “Night Shift” für den Agenten.

Day Shift: Der Mensch plant

In der ersten Phase wird aus einer vagen Idee eine präzise Spezifikation. Das passiert in drei Schritten:

  1. Die Idee grillen (Shared Design Concept): Matt kritisiert die reine “Specs-to-Code”-Bewegung. Man darf Spezifikationen nicht einfach blind über den Zaun an die KI werfen. Das Ziel ist es, in einem “Human-in-the-Loop”-Prozess ein Shared Design Concept zu erarbeiten – Entwickler und KI müssen exakt auf derselben Wellenlänge sein, bevor auch nur eine Zeile Code entsteht.
  2. Vertikale Slices & Tracer Bullets: Das Projekt wird nicht “horizontal” in Schichten zerlegt (erst komplette Datenbank, dann API, dann Frontend). KI neigt dazu, blind zu arbeiten, bis diese Schichten integriert werden. Pocock nutzt hier die “Tracer Bullets”-Metapher (Leuchtspurmunition) aus The Pragmatic Programmer: Es werden vertikale Slices gebaut, die einmal durch alle Schichten feuern und so sofortiges visuelles und technisches Feedback liefern.
  3. Aufgaben organisieren: Die vertikalen Slices werden als unabhängige Issues in einem Kanban-Board organisiert. Jedes Issue enthält alle Informationen, die der Agent für die spätere isolierte Umsetzung braucht.

Der exakte Prompt-Kern für Matts /grill-me Skill lautet:

Interview me relentlessly about every aspect of this plan until we reach a shared understanding.
Walk down each branch of the design tree, resolving dependencies one by one.
For each question, provide your recommended answer.
Ask the questions one at a time.

Night Shift: Der Agent implementiert

In der zweiten Phase übernimmt der KI-Agent die Arbeit. Während die Planungsphase zwingend menschliche Beteiligung erfordert, wandeln sich die Aufgaben hier in AFK-Tasks (Away From Keyboard). Der Agent nimmt sich eine Aufgabe vom Kanban-Board, liest den Kontext und implementiert das Feature völlig autonom. Durch das Kanban-System lassen sich sogar mehrere unabhängige Agenten parallel einsetzen.

Das Entscheidende ist die Methode: Strikte testgetriebene Entwicklung (TDD).

graph TD
    A[Start: Red] -->|Schreibt fehlschlagenden Test| B(Green)
    B -->|Schreibt minimalen Code zum Bestehen| C(Refactor)
    C -->|Code bereinigen ohne Verhaltensänderung| D{Tests grün?}
    D -- Nein --> B
    D -- Ja --> E[Commit & Next]
  • Red: Der Agent schreibt zuerst einen fehlschlagenden Test. Der Test beschreibt exakt das gewünschte Verhalten.
  • Green: Der Agent schreibt den minimalen Code, der nötig ist, damit der Test besteht. Nicht mehr.
  • Refactor: Der Agent bereinigt die Implementierung, ohne das Verhalten zu verändern.

Dieser Zyklus verhindert, dass der Agent improvisiert oder unnötigen Code produziert. Der Test ist die Leitplanke. Wenn der Test besteht, wird der Code committet und das Issue geschlossen.

Agent-Skills als wiederverwendbare Werkzeuge

Matt Pocock hat seine Arbeitsweise in ein Open-Source-Repository überführt: mattpocock/skills auf GitHub. Das sind keine vagen Prompt-Vorlagen, sondern strukturierte, wiederverwendbare Workflows für KI-Agenten.

Die wichtigsten Skills im Überblick:

  • Planungsphase: /to-prd, /to-issues, /grill-me und /design-an-interface.
  • Entwicklungsphase: /tdd, /triage-issue und /improve-codebase-architecture.
  • Absicherung: /git-guardrails-claude-code und /setup-pre-commit.

Hinweis zur Methodik: Während /grill-me den Agenten zwingt, Rückfragen zu stellen, erzwingt der /tdd Skill strikte Feedback-Schleifen. Matt Pocock beschreibt diesen essenziellen Prozess im Workshop so:

“What it’s essentially doing is instrumenting the code before it’s then writing the code. […] I find that TDD is so, so good for places where you can pull it off. In fact, it’s so good that I sort of warp my whole technique around getting TDD to work better. […] These feedback loops are essential.”

Warum dieser Ansatz funktioniert

Der Workflow löst die drei größten Probleme beim Einsatz von KI-Agenten gleichzeitig:

  1. Er verhindert Kontextverlust: Jede Aufgabe wird in einer frischen Sitzung bearbeitet.
  2. Er verhindert unkontrollierten Code: Der TDD-Zyklus dient als unbestechliche Qualitätssicherung. Kein Code ohne Test.
  3. Er erhält die menschliche Kontrolle: Die Architektur und Planung liegen komplett beim Entwickler. Der Agent implementiert lediglich.

Das schützt Entwickler davor, in die typische Falle des agentischen Codings zu tappen, bei der durch blinde Delegation das eigene Systemverständnis verloren geht.

Was wir daraus mitnehmen können

Matt Pococks Grundsatz ist klar: Wenn ein KI-Agent einen Fehler macht, sollte daraus eine Regel entstehen. Kein einmaliger Fix, sondern ein dauerhafter Skill, der diesen Fehler in Zukunft verhindert.

Das gilt für alle, die mit KI-Agenten arbeiten. Wir brauchen keine besseren Modelle. Wir brauchen bessere Prozesse für den Umgang mit den vorhandenen Modellen: Klare Aufgaben, kurze Sitzungen, automatisierte Qualitätsprüfungen.

Der Workshop zeigt, dass professionelles KI-gestütztes Coding kein Widerspruch ist. Es erfordert mehr Engineering-Disziplin, nicht weniger. Genau das macht es nachhaltig.

Autor hyretic

Senior Full-Stack Developer mit Fokus auf stabiler Software-Architektur, pragmatischem Engineering und der Realität von KI im Entwickler-Alltag. Seine Wurzeln liegen im praktischen Lösen komplexer Probleme unter realen Bedingungen.

github.com/hyretic-dev

Ähnliche Artikel