1. Neue Konversation pro Thema starten
Das ist der wirkungsvollste Tipp. Sobald ein Thema „fertig“ ist, starte einen neuen Chat. Nicht alles in einen Monster-Thread packen. Jeder Themenwechsel ist ein guter Zeitpunkt für einen neuen Chat.
Faustregel: Nach 15-20 Nachrichten wird jeder weitere Austausch unverhältnismässig teuer. Starte neu.
2. Fragen bündeln
Statt drei einzelne Nachrichten zu schicken:
- ❌ „Was ist X?“ → Antwort → „Und ein Beispiel?“ → Antwort → „Und Verbesserungen?“
- ✅ „Bitte: 1) Erkläre X, 2) Gib ein Beispiel, 3) Schlage Verbesserungen vor“
Jede neue Nachricht erzwingt eine komplette Kontext-Neuverarbeitung. Drei Fragen in einer Nachricht sparen massiv Tokens gegenüber drei separaten Nachrichten.
3. Kontext bewusst klein halten
Gib nur das in den Chat, was für die aktuelle Aufgabe wirklich gebraucht wird. Lange Protokolle, E-Mails oder Dokumentationen vorher selbst grob kürzen oder in Abschnitte aufteilen und kapitelweise bearbeiten lassen.
4. Dateien im Workspace sparsam einsetzen
In Claude Projekten: Nur die Dateien hinzufügen, die für die aktuelle Session relevant sind. Grosse Dateien in logische Häppchen splitten (z.B. kapitelweise) und nur den gerade benötigten Teil anhängen.
Nicht „zur Sicherheit“ riesige Datenmengen im Projekt liegen lassen.
5. Wiederholtes Hochladen vermeiden
Wenn du dieselbe Datei in mehreren Sessions brauchst: Lass Claude beim ersten Mal eine komprimierte Zusammenfassung erstellen. In späteren Sessions arbeitest du nur noch mit dieser Zusammenfassung — das spart bei jedem Folge-Chat tausende Tokens.
6. Modellwahl bewusst treffen
Nutze das richtige Modell für die richtige Aufgabe:
| Aufgabe | Empfohlenes Modell | Warum |
| Komplexe Analyse, langes Reasoning | Opus | Beste Qualität, aber teuer |
| Alltags-Aufgaben, Texte, Code | Sonnet | Guter Allrounder |
| Rechtschreibung, kleine Umformulierungen, einfache Fragen | Haiku | Schnell und sehr sparsam |
Das „dicke Brett“ nur für wirklich komplexe Sachen — für einfache Aufgaben reicht Haiku oder Sonnet völlig.
7. Nutzungsmuster beobachten
Schau regelmässig auf den Nutzungsbalken in den Einstellungen unter claude.ai/settings/usage. Dort siehst du in Echtzeit, wie viel von deinem aktuellen 5-Stunden-Fenster verbraucht ist. Welche Sessions fressen besonders viel? Typische Token-Fresser sind:
- Immer wieder ganze Dokumente reinkopieren (statt Zusammenfassung)
- Ein einziger Endlos-Chat für alles
- Grosse Codebasen komplett im Kontext halten
8. Hybride Workflows nutzen
Nicht alles muss durch Claude. Vorverarbeitung (Textbereinigung, Formatkonvertierung, einfache Filterung) mit anderen Tools erledigen und Claude nur für die „High-Value-Schritte“ nutzen — Analyse, Synthese, kreative Arbeit.
Beispiel: Statt ein 100-seitiges PDF komplett an Claude zu geben, extrahiere zuerst die relevanten Seiten mit einem PDF-Tool und gib nur diese an Claude.
9. Extended Thinking sparsam einsetzen
Claudes „Extended Thinking“-Modus (das tiefe Nachdenken) verbraucht deutlich mehr Tokens als normale Antworten. Aktiviere ihn nur, wenn du wirklich komplexe Reasoning-Aufgaben hast — nicht für einfache Fragen.