Inhaltsverzeichnis
Eine der ersten Fragen bei der Nutzung von Claude lautet: „Soll ich Opus, Sonnet oder Haiku verwenden?"
Die drei Modelle unterscheiden sich im API-Preis um bis zu Faktor 5, mit klaren Leistungsunterschieden. Aber das teuerste Modell ist nicht immer die beste Wahl. Für manche Aufgaben ist Haiku praktischer, während andere wirklich Opus erfordern.
Dieser Artikel vergleicht die aktuellen Preise, Leistungsdaten und Geschwindigkeiten (Stand April 2026) und enthält Kostenschätzungen pro Aufgabe, damit Sie die richtige Wahl treffen.
1. Die drei Modelle im Überblick
| Modell | Positionierung | Veröffentlicht | Kurzfassung |
|---|---|---|---|
| Opus 4.6 | Flaggschiff | Feb. 2026 | Am intelligentesten. Für Agenten und komplexe Programmierung |
| Sonnet 4.6 | Ausgewogen | Feb. 2026 | Optimale Balance aus Geschwindigkeit und Intelligenz. Ideal für den Alltag |
| Haiku 4.5 | Schnell & Günstig | Okt. 2025 | Am schnellsten. Für Massenverarbeitung und Echtzeitaufgaben |
Die Namen spiegeln literarische Textlängen wider. Ein Opus (ein großes Werk) steht für tiefgründiges Denken, ein Sonett (ein 14-zeiliges Gedicht) bietet ausgewogene Tiefe, und ein Haiku (ein 3-zeiliges Gedicht) liefert schnelle, prägnante Antworten.
2. API-Preisvergleich
Standardpreise (pro Million Token)
| Modell | Input | Output | Batch-Input | Batch-Output | Cache-Treffer |
|---|---|---|---|---|---|
| Opus 4.6 | 5 $ | 25 $ | 2,50 $ | 12,50 $ | 0,50 $ |
| Sonnet 4.6 | 3 $ | 15 $ | 1,50 $ | 7,50 $ | 0,30 $ |
| Haiku 4.5 | 1 $ | 5 $ | 0,50 $ | 2,50 $ | 0,10 $ |
Der Unterschied zwischen dem teuersten (Opus-Output mit 25 $/MTok) und dem günstigsten Tarif (Haiku-Output mit 5 $/MTok) beträgt Faktor 5. Allerdings ist Opus 4.6 tatsächlich 3-mal günstiger als sein Vorgänger (Opus 4.1 kostete 75 $/MTok).
Tipps zur Kostensenkung
Die Batch-API halbiert die Kosten, und Cache-Treffer reduzieren die Eingabekosten auf ein Zehntel. In Kombination lassen sich bis zu 95 % Ersparnis erzielen. Bei großem Verarbeitungsvolumen sollten Sie diese Optionen zuerst prüfen.
Was ist ein „Token"?
API-Preise basieren auf „Token". Im Englischen gilt ungefähr 1 Wort ≈ 1,3 Token. Eine Million Token entspricht circa 750.000 Wörtern — das sind etwa 10 durchschnittlich lange Romane.
3. Abo-Pläne
Monatsabonnements bieten eine grundlegend andere Preisstruktur als das API-Bezahlmodell nach Verbrauch.
| Plan | Preis | Verfügbare Modelle | Standard |
|---|---|---|---|
| Free | 0 $ | Nur Sonnet 4.5 | Sonnet 4.5 |
| Pro | 20 $/Monat | Alle Modelle | Sonnet 4.6 |
| Max 5x | 100 $/Monat | Alle Modelle | Opus 4.6 |
| Max 20x | 200 $/Monat | Alle Modelle | Opus 4.6 |
Abonnements sind zwar nicht „unbegrenzt", haben aber Nutzungslimits. Trotzdem sind sie 15- bis 30-mal günstiger als API-Preise. Ein Nutzer berichtete, über 8 Monate 10 Milliarden Token verbraucht zu haben — bei API-Tarifen wären das über 15.000 $ gewesen, sein Max-Abo kostete dagegen rund 800 $.
Modellwechsel in Claude Code
In Claude Code können Sie das Modell beim Start mit claude --model opus oder claude --model sonnet wählen, oder während der Sitzung mit /model sonnet wechseln. Pro nutzt standardmäßig Sonnet, Max standardmäßig Opus. Weitere Details zu Claude Code finden Sie unter Claude Chat vs. Cowork vs. Code.
4. Leistungs-Benchmarks
| Benchmark | Was wird gemessen | Opus 4.6 | Sonnet 4.6 | Unterschied |
|---|---|---|---|---|
| SWE-bench Verified | Programmierfähigkeit | 80,8 % | 79,6 % | Nur 1,2 Pkt. |
| GPQA Diamond | Wissenschaftliches Denken | 91,3 % | 74,1 % | 17,2 Pkt. |
| OSWorld-Verified | GUI-Automatisierung | 72,7 % | 72,5 % | Nahezu gleich |
| Math | Mathematische Aufgaben | — | 89 % | — |
Das auffälligste Ergebnis: Der Programmier-Leistungsunterschied beträgt nur 1,2 Punkte. Sonnet 4.6 ist das erste Sonnet in der Geschichte von Claude, das in Coding-Benchmarks an das Opus der vorherigen Generation heranreicht.
Allerdings zeigt sich beim wissenschaftlichen Denken (GPQA Diamond) ein Abstand von 17,2 Punkten, was Opus bei akademischen Analysen und komplexem logischen Denken klar überlegen macht.
Offizielle Benchmarks für Haiku 4.5 sind begrenzt, doch Anthropic positioniert es als Modell mit „nahezu führender Intelligenz". Bei einfachen Aufgaben dürfte es annähernd an Sonnets Genauigkeit herankommen.
5. Geschwindigkeit und Kontextfenster
| Modell | Geschwindigkeit (ca.) | Kontextfenster | Max. Output |
|---|---|---|---|
| Opus 4.6 | ~20–30 Tok./Sek. | 1 Mio. Token | 128K Token |
| Sonnet 4.6 | ~40–60 Tok./Sek. | 1 Mio. Token | 64K Token |
| Haiku 4.5 | 2–5x schneller als Sonnet | 200K Token | 64K Token |
Haikus größte Stärke ist die Geschwindigkeit. Es hat die kürzeste Time-to-First-Token (TTFT) und eignet sich ideal für Echtzeit-Chatbots und Autovervollständigung.
Opus bietet ein Kontextfenster von 1 Million Token (ca. 10–20 Romane) für Aufgaben wie die Verarbeitung ganzer Codebasen auf einmal. Sein maximaler Output von 128K Token ist doppelt so hoch wie bei Sonnet/Haiku und eignet sich für die Generierung langer Dokumente in einem Durchgang.
6. Kostenschätzungen nach Anwendungsfall
So viel kosten typische Aufgaben zu Standard-API-Tarifen (ohne Caching oder Batching).
Szenario 1: Einen 2.000-Wörter-Artikel generieren
Input: ~1.000 Token, Output: ~2.700 Token
| Modell | Input-Kosten | Output-Kosten | Gesamt |
|---|---|---|---|
| Opus 4.6 | 0,005 $ | 0,068 $ | ~0,07 $ |
| Sonnet 4.6 | 0,003 $ | 0,041 $ | ~0,04 $ |
| Haiku 4.5 | 0,001 $ | 0,014 $ | ~0,02 $ |
Szenario 2: Eine Code-Datei lesen und refaktorisieren
Input: ~10.000 Token (Code + Anweisungen), Output: ~5.000 Token
| Modell | Input-Kosten | Output-Kosten | Gesamt |
|---|---|---|---|
| Opus 4.6 | 0,05 $ | 0,125 $ | ~0,18 $ |
| Sonnet 4.6 | 0,03 $ | 0,075 $ | ~0,11 $ |
| Haiku 4.5 | 0,01 $ | 0,025 $ | ~0,04 $ |
Szenario 3: Chatbot mit 1.000 Anfragen pro Tag
200 Input-Token + 300 Output-Token pro Anfrage x 1.000
| Modell | Tageskosten | Monatlich (30 Tage) |
|---|---|---|
| Opus 4.6 | 8,50 $ | 255 $ |
| Sonnet 4.6 | 5,10 $ | 153 $ |
| Haiku 4.5 | 1,70 $ | 51 $ |
Bei Szenarien mit hohem Volumen wie Chatbots übersteigt der monatliche Unterschied zwischen Haiku und Opus 200 $. Ein praktischer Ansatz ist, Haiku als Standard zu verwenden und nur komplexe Anfragen an Sonnet oder Opus weiterzuleiten.
7. Welches Modell passt zu Ihnen?
| Anwendungsfall | Empfehlung | Begründung |
|---|---|---|
| Tägliche Programmierung & Texte | Sonnet 4.6 | 98 % der Coding-Qualität von Opus, 40 % günstiger, 2x schneller |
| Groß angelegtes Refactoring | Opus 4.6 | 1-Mio.-Kontextfenster und 128K-Output zeigen hier ihre Stärke |
| Akademische Analyse | Opus 4.6 | 17 Punkte Vorsprung bei GPQA. Tiefes Denken ist nicht ersetzbar |
| Chatbots & Support | Haiku 4.5 | Am schnellsten + am günstigsten. Perfekt für Standardantworten |
| Massenverarbeitung | Haiku 4.5 | Ein Fünftel der Kosten, effizient bei großem Volumen |
| Claude Code-Entwicklung | Sonnet 4.6 | Der Pro-Plan reicht aus. Nur bei komplexer Architektur auf Opus wechseln |
Praxistipp
Im Zweifel: Starten Sie mit Sonnet. Es bewältigt die meisten Aufgaben gut. Wechseln Sie nur zu Opus, wenn Sonnets Ausgabequalität nicht ausreicht, und zu Haiku bei einfachen, sich wiederholenden Aufgaben. Dieser abgestufte Ansatz bietet das beste Preis-Leistungs-Verhältnis.
FAQ
Wie groß ist der Leistungsunterschied beim Programmieren zwischen Opus und Sonnet?
Beim SWE-bench Verified (einem Coding-Benchmark) erreicht Opus 4.6 80,8 % und Sonnet 4.6 79,6 % — ein Unterschied von nur 1,2 Punkten. Im Alltag der Programmierung ist der Unterschied kaum spürbar. Angesichts des Preisunterschieds (25 $ vs. 15 $/MTok für Output) bietet Sonnet das bessere Preis-Leistungs-Verhältnis. Bei groß angelegtem Architekturdesign und komplexen Denkaufgaben hat Opus jedoch einen klaren Vorteil.
Ist ein Abo oder die API-Abrechnung nach Verbrauch günstiger?
Bei regelmäßiger Nutzung sind Abonnements deutlich günstiger — etwa 15- bis 30-mal kosteneffizienter als API-Preise. Selbst der Pro-Plan (20 $/Monat) würde bei entsprechender API-Nutzung über 180 $/Monat kosten. API-Preise lohnen sich nur bei sehr seltener Nutzung oder speziellen Batch-Szenarien. Einen Preisvergleich mit ChatGPT finden Sie unter Claude vs. ChatGPT Preisvergleich.
Wie „intelligent" ist Haiku 4.5?
Anthropic beschreibt es als Modell mit „nahezu führender Intelligenz". Obwohl offizielle Benchmarks begrenzt sind, dürfte es bei einfachen Aufgaben wie Textklassifizierung, Zusammenfassungen und Frage-Antwort an die Genauigkeit von Sonnet herankommen. Bei komplexem Denken oder langer Code-Generierung wird der Abstand zu Sonnet/Opus deutlich. Bei einem Fünftel der Kosten glänzt es dort, wo „ausreichende Qualität bei großem Volumen" gefragt ist.
Ist Opus 4.6 günstiger als frühere Opus-Modelle?
Ja, deutlich. Opus 4.1 berechnete 75 $/MTok für Output, Opus 4.6 nur noch 25 $/MTok — eine Preisreduzierung um Faktor 3 bei gleichzeitig besserer Leistung. Das Kontextfenster wurde zudem von 200K auf 1 Million Token erweitert (5-fache Steigerung), was das Preis-Leistungs-Verhältnis erheblich verbessert.