1. Neue Sessions starten — mit Übergabe-Prompt
Der größte Token-Fresser: Lange Sessions. Mit jeder Nachricht wächst der Kontext, den Claude bei jeder Antwort mitverarbeiten muss. Nach 20-30 Nachrichten in einer Cowork-Session verbraucht jede neue Antwort enorme Token-Mengen.
Regel: Starte eine neue Session, sobald du das Thema wechselst. Lieber 5 kurze Sessions als eine endlose.
Profi-Tipp: Bevor du einen langen Chat beendest, bitte Claude: "Fasse die wichtigsten Erkenntnisse zusammen und formuliere einen Prompt, mit dem ein neuer Chat nahtlos anknüpfen kann." So geht kein Kontext verloren, aber der Token-Ballast wird abgeworfen.
2. Context Files schlank halten
Deine CLAUDE.md und andere Context Files werden bei jeder Nachricht mitgesendet. Wenn deine CLAUDE.md 5.000 Wörter lang ist, kostet dich das bei jeder einzelnen Nachricht Tokens.
Tipps:
- Halte CLAUDE.md unter 500 Wörter — nur das Wichtigste
- Nutze Projekt-spezifische Context Files statt alles in eine Datei zu packen
- Entferne Context Files, die du für die aktuelle Aufgabe nicht brauchst
- Custom Instructions präzise formulieren — je klarer sie sind, desto weniger Korrekturschleifen braucht es im Chat
Mehr dazu: Die Kontext-Pyramide: So strukturierst du Claude richtig
3. Connectors gezielt aktivieren
Jeder aktive Connector fügt Tool-Definitionen zum Kontext hinzu — auch wenn du ihn gerade nicht brauchst. Wenn Google Drive, Gmail, Calendar, Slack und Notion gleichzeitig aktiv sind, verbrauchst du bei jeder Nachricht Tokens für 5 Connector-Definitionen.
Regel: Aktiviere nur die Connectors, die du für die aktuelle Aufgabe brauchst. Deaktiviere den Rest.
4. Präzise Prompts statt vager Anweisungen
Vage Prompts führen zu langen Antworten und Nachfragen — beides kostet Tokens. Wer vorher zwei Minuten in die Formulierung investiert, spart danach Token im dreistelligen Bereich.
- Statt: "Schau mal in meine E-Mails" → "Fasse die letzten 3 E-Mails von max@firma.de in je einem Satz zusammen"
- Statt: "Hilf mir mit meinem Projekt" → "Erstelle eine Gliederung für einen Blogpost zum Thema X mit 5 Abschnitten"
- Kontext, Ziel und gewünschtes Format gleich mitliefern
5. Ergebnisse in Dateien auslagern — nicht im Chat wiederholen
Claude kann Ergebnisse direkt als Datei speichern (Markdown, DOCX, XLSX). Das ist effizienter, als lange Texte im Chat-Verlauf mitzuschleppen, die bei jeder weiteren Nachricht erneut mitgesendet werden.
Wichtig: Wenn Claude ein Ergebnis in eine Datei geschrieben hat, muss es nicht zusätzlich im Chat nochmal ausführlich erläutert werden. Ein kurzer Hinweis reicht. Wer das Ergebnis nochmal im Chat sehen will, zahlt doppelt.
6. Große Dokumente clever handhaben
Jede hochgeladene Datei verbraucht Tokens. Nicht den ganzen Ordner hochladen, wenn nur drei Seiten relevant sind.
- PDFs aufteilen: Ein 80-Seiten-PDF in einem Rutsch verarbeiten zu lassen ist teuer. Besser: in logische Abschnitte aufteilen und schrittweise bearbeiten, idealerweise in separaten Chats
- Nur relevante Seiten: Bei PDFs die relevanten Seiten extrahieren, bevor sie in den Chat gehen
- Nicht mehrfach hochladen: Dieselbe Datei in verschiedenen Nachrichten hochzuladen kostet jedes Mal erneut Tokens
7. Aufgaben-Architektur: Erst günstig, dann teuer
Komplexe Projekte profitieren von einer durchdachten Reihenfolge:
- Recherchieren und sammeln mit einem günstigeren Modell (Sonnet oder Haiku)
- Analysieren und schreiben mit dem stärkeren Modell (Opus)
- Teilaufgaben in eigenen Chats erledigen und Zwischenergebnisse als Dateien sichern
Cowork kann auch Sub-Agents für Teilaufgaben starten. Die arbeiten mit eigenem, begrenztem Kontext und belasten den Haupt-Chat nicht mit Tokens. Besonders sinnvoll bei Recherche- oder Prüfaufgaben.