RAG · Playbook

Wissen, Stil und Charakter
eines KI-Agenten — in drei Hebeln.

Ein editorial Leitfaden zu KI-Agenten mit RAG für Einsteiger: was ein Agent ist, wie Prompting, RAG und Fine-Tuning zusammenspielen — und warum Drift selten ein Modell- und meist ein Daten- oder Anweisungsproblem ist. Ein technisch dichter Playbook-Modus für TypeScript-/SaaS-Setups: Retrieval-Pipeline mit Filtern, Re-Ranking und Hybrid-Search, Layered-Instruction-Architektur, Memory-Schicht und Compliance unter DSGVO, GoBD und EU AI Act.

Die drei Hebel ansehen Strategie-Wizard starten ⌘ Wechsle oben den Persona-Modus
↓ Scroll · Editorial Prototyp
§ 01 · Grundlagen

Was ist ein KI-Agent?

Ein KI-Agent ist wie ein sehr schlaues Software-Werkzeug, das Texte lesen und schreiben kann und dabei versucht, dir Aufgaben abzunehmen. Statt jeden Prompt neu zu schreiben, bekommt der Agent eine feste Rolle und folgt dauerhaft diesen Regeln.

Persönliche und projektbezogene KI-Agenten kombinieren RAG, starkes Prompting und optionales Fine-Tuning — Personalisierung hoch, Drift kontrollierbar 12. Adressat: technische Nutzer mit TypeScript-/SaaS-Fokus, Multi-Agent-Workflows und Compliance-Anforderungen (DSGVO, GoBD, EU AI Act).

Drei Bausteine
Hover zum Fokussieren

Für die meisten Einsteiger-Use-Cases reicht eine gute Kombination aus Prompting + RAG völlig aus; Fine-Tuning kommt erst später ins Spiel 23.

Sobald domänenspezifisches Wissen oder sich ändernde Fakten ins Spiel kommen, stößt Prompting allein an Grenzen 23. RAG bindet Antworten an aktuelle, auditierbare Quellen 13.

§ 02 · Die drei Hebel

Prompting, RAG, Fine-Tuning — im Vergleich.

PROMPTING

Charakter und Rolle

Was du dem Modell als Aufgabe und Rolle beschreibst — z.B. „Du bist ein geduldiger Lehrer…". Nur Prompting reicht für Brainstorming, allgemeine Fragen und Experimente 23.

  • · „Hilf mir, eine To-Do-Liste für die Woche zu erstellen."
  • · „Erkläre mir Kubernetes in einfachen Worten."
  • · „Gib mir 5 Ideen, wie ich mein SaaS-Produkt vermarkten könnte."

Reines Prompting nutzt das Basismodell ohne externe Wissensquelle und eignet sich vor allem für Strukturierung, Ideation, Transformation und kurzfristige Experimente mit neuen Agent-Rollen 4.

Sobald domänenspezifisches Wissen oder Fakten ins Spiel kommen, produziert Prompting allein häufiger Halluzinationen 23.

SYSTEM-PROMPT · MUSTER
Du bist ein hilfsbereiter Erklär-Agent.
Erkläre technische Themen in einfachen
Worten und gib Beispiele.

[ROLE = Senior Erklärer]
[LANG = de]
[STYLE = kurz, konkret]
RAG

Wissen — zur Laufzeit eingebunden

Mit RAG bekommt der Agent vor jeder Antwort gezielt Auszüge aus deinen Dokumenten in den Kontext gelegt 54. Du kannst dir RAG vorstellen wie eine Kombination aus „Suche" + „Chatbot" 4.

Sobald dein Agent mit deinen eigenen Notizen, Kundendokumenten, Code oder Tickets arbeitet, ist RAG fast immer die bessere Wahl als reines Prompting 23.

RAG ergänzt das Modell zur Laufzeit um externe Dokumente, die per Retrieval gesucht und in den Kontext eingespeist werden 53. Das Modell bleibt unverändert, Antworten werden an versionierte, auditierbare Quellen gebunden 1.

RETRIEVE-THEN-READ · PSEUDO-TS
// 1. Filter nach Metadaten
const cand = await db.where({
  project_id, version: "current"
});
// 2. Vektor-Suche (Top 20–50)
const hits = await vec.search(query, cand, 30);
// 3. Re-Rank → Top-k
const top  = await rerank(query, hits, 5);
// 4. Prompt mit Kontext
return llm({ system, context: top, query });
FINE-TUNING

Stil und Stimme — eingebacken

Fine-Tuning kommt erst, wenn Stil, Ton oder spezielle Muster extrem wichtig sind und du schon viele Beispiele gesammelt hast 73.

  • · Support-Agent in einem konsistenten Unternehmens-Ton
  • · Tausende alte Support-Chats als Stilvorlage
  • · „Persönliche Schreibstimme" für deinen Agenten

Fine-Tuning passt die Gewichte des Modells an, um Stil, Terminologie oder spezielle Entscheidungslogiken zu internalisieren 65. Geeignet bei wiederkehrenden Interaktionen und stabilem Anwendungsbereich, während Fakten weiterhin via RAG kommen 12.

PHASE 4 · FINE-TUNING
// erst, wenn Volumen + Stabilität da sind
- Historische Daten kuratieren
- Evaluation VOR dem Training
- Kleines FT-Modell aufsetzen
- Fakten weiterhin über RAG
  → Aktualität + Auditierbarkeit
Vergleichsmatrix
Aspekt Nur Prompting RAG Fine-Tuning

Indikatoren (•••○○) = Eignung/Stärke aus Strategie-Guides synthetisiert 5236.

Einfache Entscheidungstabelle
SituationEmpfohlene Strategie

Folgt aktuellen Praxis-Guides 3472.

§ 03 · Live

Die RAG-Pipeline — vom Query zur Antwort.

Erst wird passendes Wissen aus deiner Datenbank gesucht, dann hilft das Sprachmodell beim Formulieren 45. Robuste Pipelines filtern erst über Metadaten, führen darauf semantische Suche aus und re-ranken die Kandidaten, bevor sie dem Modell übergeben werden 10789.

+ Hybrid-Search-Spur (BM25 ⊕ Vektor → RRF)
PARALLELSPUR · BM25
Keyword-Match
PARALLELSPUR · VEKTOR
Semantische Nähe
RRF FUSION
→ kombinierter Score

Hybrid-Search deckt sowohl genaue Begriffe als auch semantische Nähe ab 9.

§ 04 · Drift

Drift verstehen — drei Arten, drei Hebel.

Drift bedeutet, dass der Agent sich mit der Zeit von deinen Wünschen oder von der Realität wegbewegt — er hält sich nicht mehr genau an Anweisungen oder erfindet Dinge 61. Drift wird systematisch erkannt und gegengesteuert über Telemetrie zu Retrieval-Qualität (Recall@k), Antwort-Akzeptanz und Fehlerreports 9.

§ 05 · Decision-Wizard

Welche Strategie passt zu deinem Use-Case?

Vier kurze Fragen — eine konkrete Empfehlung. Mapping aus A §11 3472. B §6 If-Then-Playbook + Tabelle A §11 1453.

EMPFEHLUNG

§ 06 · Use-Cases

Vier Anwendungen, vier Hebel-Mixe.

+ 2 weitere Use-Cases im Pro-Mode (Customer Support · Compliance & Legal).

§ 07 · Architektur

Bausteine deines Setups.

Mehr für Fortgeschrittene

Die technische Architektur ist im Pro-Mode ausführlich. Wechsle oben auf Pro, um Storage, Retrieval, Agenten-Schicht und Observability als Layer-Diagramm zu sehen.

§ 08 · Roadmap

ANTI-PATTERN

§ 09 · Prompt-Patterns

Vier Patterns gegen Drift.

Direkt aus A §9 abgeleitet 61. B §9 — Aufgabe paraphrasieren, doppelte Platzierung, Kontextvariablen, Layer-Trennung 124.

Kopiert ✓
§ 10 · Mini-Quiz

Welcher Drift ist das?

§ 11 · Glossar

Begriffe — Karte umdrehen.