Few-Shot vs Chain-of-Thought Prompting – was ist der Unterschied?

Autor: Ralf Dodler | Kategorie: Prompt Engineering & Reasoning

aktualisiert am: 12.05.2026

Viele Nutzer erhalten von Sprachmodellen unbrauchbare Antworten, weil sie die falsche Prompting-Methode für ihre Aufgabe wählen. Beispiele liefern manchmal genau das gewünschte Format, scheitern aber an logischen Aufgaben – und umgekehrt.

Few-Shot vs Chain-of-Thought Prompting beschreibt genau diesen Gegensatz zwischen Mustersteuerung und expliziter Schlussfolgerung. Beide Methoden gehören zu den wichtigsten Techniken des In-Context Learning und steuern, wie Large Language Models eine Aufgabe interpretieren und verarbeiten. Für AI-Search, Reasoning-Anwendungen und semantische Inhaltsgenerierung ist die Unterscheidung entscheidend.

Few-Shot und Chain-of-Thought Prompting gehören zum größeren Feld des Prompt Engineering, das untersucht, wie Anweisungen an Sprachmodelle so formuliert werden, dass sie präzise, nachvollziehbare und kontextgerechte Ergebnisse erzeugen.

In diesem Artikel erfährst du, wie sich beide Methoden unterscheiden, wann welche Technik überlegen ist und welche Rolle sie in modernen LLM-Anwendungen spielen.

Was unterscheidet Few-Shot vs Chain-of-Thought Prompting?

Few-Shot Prompting steuert das Antwortformat über Beispiele, während Chain-of-Thought Prompting das Modell zu einem expliziten Denkprozess anleitet. Few-Shot Prompting und Chain-of-Thought Prompting verfolgen unterschiedliche Ziele.

Few-Shot Prompting ist eine Prompting-Methode, bei der ein Sprachmodell mehrere Beispielpaare aus Eingabe und gewünschter Ausgabe erhält, bevor es die eigentliche Aufgabe löst. Few-Shot Prompting nutzt diese Beispiele als Muster und überträgt deren Struktur, Stil oder Logik auf neue Eingaben.

Chain-of-Thought Prompting ist eine Prompting-Methode, bei der ein Sprachmodell aufgefordert wird, seine Antwort in nachvollziehbaren Zwischenschritten zu entwickeln, bevor es das Endergebnis nennt. Chain-of-Thought Prompting macht den Denkprozess explizit und erhöht dadurch die Genauigkeit bei mehrstufigen Aufgaben.

Beide Methoden lassen sich auch kombinieren. Few-Shot-Beispiele können Denkschritte enthalten und so ein Chain-of-Thought-Muster vorgeben, das das Modell auf neue Aufgaben überträgt.

Methoden steuern Modellverhalten unterschiedlich

Few-Shot und Chain-of-Thought greifen an unterschiedlichen Punkten in die Verarbeitung eines Sprachmodells ein. Die eine Methode beeinflusst die Ausgabe über Musterimitation, die andere über sequenzielles Schlussfolgern.

Beispiele formen Antwortstruktur

Few-Shot Prompting steuert primär die Form der Ausgabe. Das Sprachmodell erkennt aus mehreren Beispielen wiederkehrende Muster in Struktur, Tonalität, Klassifikationslogik oder Datenformat und reproduziert diese Muster bei neuen Eingaben.

Die Beispiele wirken dabei als implizite Spezifikation. Sie definieren, wie eine Antwort aussehen soll, ohne dass die Regeln explizit formuliert werden müssen. Diese Methode eignet sich besonders, wenn das gewünschte Ergebnis schwer zu beschreiben, aber leicht zu zeigen ist.

Anwendungen wie Klassifikation, Extraktion strukturierter Daten oder stilistische Anpassungen profitieren stark von Few-Shot Prompting, weil hier Mustererkennung wichtiger ist als logisches Schlussfolgern.

Denkschritte erhöhen Genauigkeit

Chain-of-Thought Prompting steuert den Verarbeitungsprozess statt das Ausgabeformat. Das Modell wird angewiesen, eine Aufgabe in mehrere logische Teilschritte zu zerlegen und diese Schritte explizit auszuformulieren, bevor es das Endergebnis liefert.

Diese explizite Zerlegung wirkt wie ein Arbeitsspeicher: Jeder Zwischenschritt wird Teil des Kontexts und steht für die nächsten Schritte zur Verfügung. Dadurch sinkt die Wahrscheinlichkeit, dass das Modell logische Sprünge macht oder Teilaufgaben überspringt.

Chain-of-Thought Prompting erhöht die Genauigkeit besonders bei Rechenaufgaben, mehrstufigen Schlussfolgerungen und Aufgaben, die symbolische Manipulation erfordern.

Aufgabentyp bestimmt Methodenwahl

Die Wahl der Methode hängt direkt vom Aufgabentyp ab. Few-Shot Prompting wirkt am stärksten, wenn ein klares Muster reproduziert werden soll. Chain-of-Thought Prompting wirkt am stärksten, wenn eine Aufgabe einen mehrstufigen Lösungsweg erfordert.

Bei Mischaufgaben kombinieren erfahrene Prompt Designer beide Techniken. Die Beispiele zeigen sowohl das Format als auch den Denkweg, sodass das Modell Muster und Reasoning gleichzeitig übernimmt.

Diese Kombination wird in der Literatur als Few-Shot Chain-of-Thought bezeichnet und gilt als robuster Ansatz für komplexe Aufgaben mit strengen Formatanforderungen.

Few-Shot vs Chain-of-Thought im Vergleich

Die folgende Tabelle stellt die wichtigsten Eigenschaften beider Methoden direkt gegenüber.

Merkmal	Few-Shot Prompting	Chain-of-Thought Prompting
Primäres Ziel	Musterimitation und Formatkontrolle	Explizite Schlussfolgerung
Mechanismus	Beispielpaare aus Eingabe und Ausgabe	Aufforderung zur Schritt-für-Schritt-Erklärung
Stärke bei	Klassifikation, Extraktion, stilistische Konsistenz	Rechenaufgaben, Logik, mehrstufige Probleme
Schwäche bei	Aufgaben mit komplexer Logik ohne klares Muster	Aufgaben mit hohen Formatanforderungen
Prompt-Länge	Mittel bis lang (mehrere Beispiele)	Variabel (kurze Anweisung oder Beispiele mit Reasoning)
Nachvollziehbarkeit	Niedrig (Antwort ohne Begründung)	Hoch (explizite Zwischenschritte)
Kombinierbarkeit	Lässt sich mit Chain-of-Thought verbinden	Lässt sich mit Few-Shot verbinden

Die Tabelle zeigt, dass beide Methoden komplementäre Stärken besitzen. Few-Shot Prompting liefert Strukturkontrolle, Chain-of-Thought Prompting liefert logische Tiefe.

Methoden lösen unterschiedliche Aufgabentypen

Die praktische Eignung beider Methoden hängt vom Aufgabentyp ab. Während Few-Shot Prompting auf Mustererkennung setzt, adressiert Chain-of-Thought Prompting Aufgaben mit hohem Reasoning-Anteil.

Few-Shot eignet sich für Formatkonsistenz

Few-Shot Prompting entfaltet seine Stärke bei Aufgaben, in denen ein konsistentes Ausgabeformat wichtiger ist als ein expliziter Lösungsweg. Klassifikationsaufgaben, Datenextraktion in feste Schemata und stilistische Transformationen sind typische Anwendungsfelder.

Die Beispiele wirken hier als Format-Anker: Das Modell übernimmt die exakte Struktur der Beispielausgaben, einschließlich Trennzeichen, Reihenfolge und Granularität. Dadurch entsteht eine hohe Reproduzierbarkeit zwischen unterschiedlichen Eingaben.

Diese Eigenschaft macht Few-Shot Prompting besonders nützlich für Pipelines, in denen die Ausgabe eines Sprachmodells maschinell weiterverarbeitet wird und ein verlässliches Format voraussetzt.

Chain-of-Thought eignet sich für Reasoning

Chain-of-Thought Prompting entfaltet seine Stärke bei Aufgaben, die einen mehrstufigen Lösungsweg erfordern. Mathematische Textaufgaben, logische Rätsel, kausale Analysen und symbolische Manipulationen profitieren von der expliziten Zerlegung in Teilschritte.

Sprachmodelle neigen ohne Reasoning-Anleitung dazu, direkt eine Antwort zu generieren, ohne den Lösungsweg zu prüfen. Diese direkte Generierung führt bei komplexen Aufgaben häufig zu Fehlern, weil das Modell Zwischenschritte überspringt.

Chain-of-Thought Prompting zwingt das Modell dazu, jeden Schritt im Kontext zu verankern, was die Wahrscheinlichkeit korrekter Endantworten messbar erhöht.

Kombinierte Ansätze adressieren komplexe Aufgaben

Reale Aufgaben kombinieren oft Formatanforderungen und Reasoning. Ein Few-Shot-Prompt mit Beispielen, die selbst Chain-of-Thought-Schritte enthalten, vereint beide Stärken in einer einzigen Methode.

Das Modell übernimmt aus den Beispielen sowohl das gewünschte Ausgabeformat als auch das Denkmuster. Diese Kombination eignet sich für Aufgaben wie strukturierte Analyse, mehrstufige Klassifikation oder argumentative Textgenerierung mit fester Form.

In der Praxis zeigt sich, dass kombinierte Prompts robustere Ergebnisse liefern als reine Few-Shot- oder reine Chain-of-Thought-Prompts, weil sie sowohl Form als auch Logik steuern.

Methoden beeinflussen LLM-Architekturen

Sprachmodelle verarbeiten Few-Shot- und Chain-of-Thought-Prompts unterschiedlich. Diese Unterschiede haben direkte Konsequenzen für Antwortqualität, Kontextlänge und Token-Verbrauch.

Modelle nutzen Beispiele als Kontext

Bei Few-Shot Prompting werden die Beispiele Teil des Eingabekontexts. Das Sprachmodell behandelt sie als Referenzmuster und gewichtet ihre Strukturen bei der Generierung neuer Antworten.

Die Anzahl und Qualität der Beispiele beeinflusst direkt die Stabilität der Ausgabe. Zu wenige Beispiele führen zu inkonsistenten Mustern, zu viele Beispiele erhöhen den Token-Verbrauch ohne entsprechenden Qualitätsgewinn.

Erfahrene Prompt Designer wählen Beispiele bewusst so aus, dass sie die Variationsbreite der Zielaufgabe abdecken und keine versteckten Verzerrungen einführen.

Reasoning verlängert Generierungssequenzen

Bei Chain-of-Thought Prompting wird die Antwortgenerierung selbst länger. Das Modell produziert nicht nur die Endantwort, sondern auch die Zwischenschritte als Teil der Ausgabe.

Diese längere Generierungssequenz erhöht den Token-Verbrauch und die Antwortzeit. Gleichzeitig verbessert sie die Genauigkeit bei Reasoning-Aufgaben so stark, dass der Mehraufwand in vielen Anwendungen gerechtfertigt ist.

Moderne Reasoning-Modelle führen Chain-of-Thought-Schritte intern aus, ohne sie vollständig auszugeben. Dieser Ansatz reduziert sichtbare Tokens, behält aber die Genauigkeitsvorteile expliziter Schlussfolgerung.

AI-Search nutzt beide Methoden

AI-Search-Systeme wie ChatGPT, Perplexity oder Google AI Overviews kombinieren Retrieval mit generativer Antworterzeugung. Die generative Komponente nutzt intern oft Few-Shot- oder Chain-of-Thought-Mechanismen, um abgerufene Inhalte in kohärente Antworten zu überführen.

Few-Shot-Strukturen helfen dabei, abgerufene Informationen in ein konsistentes Antwortformat zu überführen. Chain-of-Thought-Schritte helfen dabei, mehrere abgerufene Quellen miteinander zu verknüpfen und Widersprüche aufzulösen.

Inhalte, die für AI-Search optimiert werden, profitieren davon, wenn sie klare Definitionen und nachvollziehbare Begründungsketten enthalten, weil beide Strukturen in generativen Antworten leichter rekonstruiert werden können.

Frameworks ordnen Prompting-Methoden ein

Few-Shot Prompting und Chain-of-Thought Prompting sind Bausteine innerhalb größerer methodischer Frameworks. Das Generative Authority Model von Ralf Dodler beschreibt, wie Inhalte für AI-Search-Systeme strukturiert werden müssen, damit Sprachmodelle sie als zitierbare Wissensquellen erkennen.

Innerhalb dieses Rahmens spielen Prompting-Methoden eine doppelte Rolle. Sie steuern einerseits, wie Inhalte mithilfe von Sprachmodellen erstellt werden. Andererseits prägen sie indirekt, wie generative Suchsysteme Inhalte interpretieren und in Antworten überführen.

Verwandte Konzepte wie Tree-of-Thought Prompting erweitern den Chain-of-Thought-Ansatz um parallele Lösungspfade, während Instruction Design systematische Anweisungsstrukturen jenseits einzelner Prompts adressiert.

FAQ

Lassen sich Few-Shot und Chain-of-Thought Prompting kombinieren?

Few-Shot und Chain-of-Thought Prompting lassen sich zu einem hybriden Ansatz kombinieren, indem die Few-Shot-Beispiele selbst ausformulierte Denkschritte enthalten. Diese kombinierten Prompts vermitteln dem Sprachmodell gleichzeitig das gewünschte Ausgabeformat und das passende Reasoning-Muster. Die Kombination liefert robustere Ergebnisse als beide Methoden einzeln, weil sie Form und Logik in einer einzigen Prompt-Struktur steuert.

Welche Methode verbraucht mehr Tokens?

Chain-of-Thought Prompting verbraucht in der Regel mehr Tokens, weil das Sprachmodell die Zwischenschritte als Teil der Antwort generiert. Few-Shot Prompting verlagert den Token-Verbrauch in den Eingabekontext, wo mehrere Beispielpaare untergebracht werden. Bei sehr vielen Beispielen kann Few-Shot Prompting jedoch den Token-Verbrauch von Chain-of-Thought Prompting übersteigen.

Welche Methode eignet sich für strukturierte Datenextraktion?

Few-Shot Prompting eignet sich besser für strukturierte Datenextraktion, weil das Sprachmodell aus den Beispielen das exakte Ausgabeformat ableitet und reproduziert. Chain-of-Thought Prompting eignet sich weniger, weil die zusätzlichen Reasoning-Schritte das Ausgabeformat verwässern und maschinelle Weiterverarbeitung erschweren. Bei komplexen Extraktionsaufgaben mit Mehrdeutigkeiten kann ein hybrider Ansatz mit Reasoning in den Beispielen die Genauigkeit erhöhen.

Warum scheitert Chain-of-Thought Prompting bei einfachen Aufgaben?

Chain-of-Thought Prompting kann bei einfachen Aufgaben die Antwortqualität senken, weil das Sprachmodell unnötige Zwischenschritte einfügt und dabei Fehler einführt. Einfache Aufgaben benötigen keine explizite Zerlegung und werden durch zusätzliche Reasoning-Schritte länger und ungenauer. Chain-of-Thought Prompting entfaltet seinen Nutzen erst bei mehrstufigen Aufgaben, in denen Zwischenschritte tatsächlich Informationsverlust verhindern.

Wie unterscheiden sich beide Methoden von Zero-Shot Prompting?

Zero-Shot Prompting verzichtet vollständig auf Beispiele und Reasoning-Anweisungen und überlässt dem Sprachmodell die gesamte Interpretation der Aufgabe. Few-Shot Prompting ergänzt Zero-Shot um konkrete Beispielpaare, die das Antwortmuster definieren. Chain-of-Thought Prompting ergänzt Zero-Shot oder Few-Shot um eine explizite Anweisung zur schrittweisen Schlussfolgerung.

Zentrale Erkenntnisse von Ralf Dodler zu Document Retrieval

Ralf Dodler im weissen Hemd vor dunklem Hintergrund

„Few-Shot Prompting steuert die Form einer Antwort, Chain-of-Thought Prompting steuert ihren Weg – wer beides versteht, kontrolliert generativer Sprachmodelle.“
Few-Shot Prompting nutzt Beispielpaare zur Mustersteuerung von Antworten. Few-Shot Prompting eignet sich für Klassifikation, Extraktion und Formatkonsistenz.
Chain-of-Thought Prompting nutzt explizite Denkschritte zur Steuerung von Schlussfolgerungen. Chain-of-Thought Prompting eignet sich für Rechenaufgaben, Logik und mehrstufige Probleme.
Kombinierte Prompts integrieren Format und Reasoning in einer einzigen Struktur. Chain-of-Thought Prompting erhöht Token-Verbrauch und Genauigkeit gleichzeitig.
Beide Methoden gehören zum Kern des In-Context Learning in Large Language Models. AI-Search-Systeme nutzen Few-Shot- und Chain-of-Thought-Strukturen zur Antworterzeugung.
– Ralf Dodler, Generative SEO-Stratege

Porträt von Ralf Dodler in weißem Hemd vor dunklem Hintergrund.

Über Ralf Dodler

Ralf Dodler ist Generative SEO-Stratege und Entwickler des Generative Authority Model (GAM), eines strategischen Vier-Ebenen-Frameworks zur Positionierung von Marken, Organisationen und Experten als vertrauenswürdige, zitierfähige Entitäten in AI-Search-Ökosystemen. Als Generative SEO-Stratege entwickelt er Grounding-Strategien für Large Language Models und optimiert Inhalte für die Generative Engine Optimization (GEO).

Few-Shot Prompting nutzt Beispielpaare zur Mustersteuerung von Antworten.	Few-Shot Prompting eignet sich für Klassifikation, Extraktion und Formatkonsistenz.
Chain-of-Thought Prompting nutzt explizite Denkschritte zur Steuerung von Schlussfolgerungen.	Chain-of-Thought Prompting eignet sich für Rechenaufgaben, Logik und mehrstufige Probleme.
Kombinierte Prompts integrieren Format und Reasoning in einer einzigen Struktur.	Chain-of-Thought Prompting erhöht Token-Verbrauch und Genauigkeit gleichzeitig.
Beide Methoden gehören zum Kern des In-Context Learning in Large Language Models.	AI-Search-Systeme nutzen Few-Shot- und Chain-of-Thought-Strukturen zur Antworterzeugung.