Eine der ersten Fragen bei der Nutzung von Claude lautet: „Soll ich Opus, Sonnet oder Haiku verwenden?"

Die drei Modelle unterscheiden sich im API-Preis um bis zu Faktor 5, mit klaren Leistungsunterschieden. Aber das teuerste Modell ist nicht immer die beste Wahl. Für manche Aufgaben ist Haiku praktischer, während andere wirklich Opus erfordern.

Dieser Artikel vergleicht die aktuellen Preise, Leistungsdaten und Geschwindigkeiten (Stand April 2026) und enthält Kostenschätzungen pro Aufgabe, damit Sie die richtige Wahl treffen.

1. Die drei Modelle im Überblick

Claudes drei Modelle: Opus (Spitzenleistung), Sonnet (ausgewogen), Haiku (schnell und günstig)
ModellPositionierungVeröffentlichtKurzfassung
Opus 4.6FlaggschiffFeb. 2026Am intelligentesten. Für Agenten und komplexe Programmierung
Sonnet 4.6AusgewogenFeb. 2026Optimale Balance aus Geschwindigkeit und Intelligenz. Ideal für den Alltag
Haiku 4.5Schnell & GünstigOkt. 2025Am schnellsten. Für Massenverarbeitung und Echtzeitaufgaben

Die Namen spiegeln literarische Textlängen wider. Ein Opus (ein großes Werk) steht für tiefgründiges Denken, ein Sonett (ein 14-zeiliges Gedicht) bietet ausgewogene Tiefe, und ein Haiku (ein 3-zeiliges Gedicht) liefert schnelle, prägnante Antworten.

2. API-Preisvergleich

Claude Opus, Sonnet und Haiku API-Preisvergleich: Input-, Output-, Batch- und Cache-Preise

Standardpreise (pro Million Token)

ModellInputOutputBatch-InputBatch-OutputCache-Treffer
Opus 4.65 $25 $2,50 $12,50 $0,50 $
Sonnet 4.63 $15 $1,50 $7,50 $0,30 $
Haiku 4.51 $5 $0,50 $2,50 $0,10 $

Der Unterschied zwischen dem teuersten (Opus-Output mit 25 $/MTok) und dem günstigsten Tarif (Haiku-Output mit 5 $/MTok) beträgt Faktor 5. Allerdings ist Opus 4.6 tatsächlich 3-mal günstiger als sein Vorgänger (Opus 4.1 kostete 75 $/MTok).

Tipps zur Kostensenkung

Die Batch-API halbiert die Kosten, und Cache-Treffer reduzieren die Eingabekosten auf ein Zehntel. In Kombination lassen sich bis zu 95 % Ersparnis erzielen. Bei großem Verarbeitungsvolumen sollten Sie diese Optionen zuerst prüfen.

Was ist ein „Token"?

API-Preise basieren auf „Token". Im Englischen gilt ungefähr 1 Wort ≈ 1,3 Token. Eine Million Token entspricht circa 750.000 Wörtern — das sind etwa 10 durchschnittlich lange Romane.

3. Abo-Pläne

Monatsabonnements bieten eine grundlegend andere Preisstruktur als das API-Bezahlmodell nach Verbrauch.

PlanPreisVerfügbare ModelleStandard
Free0 $Nur Sonnet 4.5Sonnet 4.5
Pro20 $/MonatAlle ModelleSonnet 4.6
Max 5x100 $/MonatAlle ModelleOpus 4.6
Max 20x200 $/MonatAlle ModelleOpus 4.6

Abonnements sind zwar nicht „unbegrenzt", haben aber Nutzungslimits. Trotzdem sind sie 15- bis 30-mal günstiger als API-Preise. Ein Nutzer berichtete, über 8 Monate 10 Milliarden Token verbraucht zu haben — bei API-Tarifen wären das über 15.000 $ gewesen, sein Max-Abo kostete dagegen rund 800 $.

Modellwechsel in Claude Code

In Claude Code können Sie das Modell beim Start mit claude --model opus oder claude --model sonnet wählen, oder während der Sitzung mit /model sonnet wechseln. Pro nutzt standardmäßig Sonnet, Max standardmäßig Opus. Weitere Details zu Claude Code finden Sie unter Claude Chat vs. Cowork vs. Code.

4. Leistungs-Benchmarks

BenchmarkWas wird gemessenOpus 4.6Sonnet 4.6Unterschied
SWE-bench VerifiedProgrammierfähigkeit80,8 %79,6 %Nur 1,2 Pkt.
GPQA DiamondWissenschaftliches Denken91,3 %74,1 %17,2 Pkt.
OSWorld-VerifiedGUI-Automatisierung72,7 %72,5 %Nahezu gleich
MathMathematische Aufgaben89 %

Das auffälligste Ergebnis: Der Programmier-Leistungsunterschied beträgt nur 1,2 Punkte. Sonnet 4.6 ist das erste Sonnet in der Geschichte von Claude, das in Coding-Benchmarks an das Opus der vorherigen Generation heranreicht.

Allerdings zeigt sich beim wissenschaftlichen Denken (GPQA Diamond) ein Abstand von 17,2 Punkten, was Opus bei akademischen Analysen und komplexem logischen Denken klar überlegen macht.

Offizielle Benchmarks für Haiku 4.5 sind begrenzt, doch Anthropic positioniert es als Modell mit „nahezu führender Intelligenz". Bei einfachen Aufgaben dürfte es annähernd an Sonnets Genauigkeit herankommen.

5. Geschwindigkeit und Kontextfenster

ModellGeschwindigkeit (ca.)KontextfensterMax. Output
Opus 4.6~20–30 Tok./Sek.1 Mio. Token128K Token
Sonnet 4.6~40–60 Tok./Sek.1 Mio. Token64K Token
Haiku 4.52–5x schneller als Sonnet200K Token64K Token

Haikus größte Stärke ist die Geschwindigkeit. Es hat die kürzeste Time-to-First-Token (TTFT) und eignet sich ideal für Echtzeit-Chatbots und Autovervollständigung.

Opus bietet ein Kontextfenster von 1 Million Token (ca. 10–20 Romane) für Aufgaben wie die Verarbeitung ganzer Codebasen auf einmal. Sein maximaler Output von 128K Token ist doppelt so hoch wie bei Sonnet/Haiku und eignet sich für die Generierung langer Dokumente in einem Durchgang.

6. Kostenschätzungen nach Anwendungsfall

So viel kosten typische Aufgaben zu Standard-API-Tarifen (ohne Caching oder Batching).

Szenario 1: Einen 2.000-Wörter-Artikel generieren

Input: ~1.000 Token, Output: ~2.700 Token

ModellInput-KostenOutput-KostenGesamt
Opus 4.60,005 $0,068 $~0,07 $
Sonnet 4.60,003 $0,041 $~0,04 $
Haiku 4.50,001 $0,014 $~0,02 $

Szenario 2: Eine Code-Datei lesen und refaktorisieren

Input: ~10.000 Token (Code + Anweisungen), Output: ~5.000 Token

ModellInput-KostenOutput-KostenGesamt
Opus 4.60,05 $0,125 $~0,18 $
Sonnet 4.60,03 $0,075 $~0,11 $
Haiku 4.50,01 $0,025 $~0,04 $

Szenario 3: Chatbot mit 1.000 Anfragen pro Tag

200 Input-Token + 300 Output-Token pro Anfrage x 1.000

ModellTageskostenMonatlich (30 Tage)
Opus 4.68,50 $255 $
Sonnet 4.65,10 $153 $
Haiku 4.51,70 $51 $

Bei Szenarien mit hohem Volumen wie Chatbots übersteigt der monatliche Unterschied zwischen Haiku und Opus 200 $. Ein praktischer Ansatz ist, Haiku als Standard zu verwenden und nur komplexe Anfragen an Sonnet oder Opus weiterzuleiten.

7. Welches Modell passt zu Ihnen?

Modellauswahl-Flussdiagramm: Opus, Sonnet oder Haiku je nach Aufgabenkomplexität und Volumen
AnwendungsfallEmpfehlungBegründung
Tägliche Programmierung & TexteSonnet 4.698 % der Coding-Qualität von Opus, 40 % günstiger, 2x schneller
Groß angelegtes RefactoringOpus 4.61-Mio.-Kontextfenster und 128K-Output zeigen hier ihre Stärke
Akademische AnalyseOpus 4.617 Punkte Vorsprung bei GPQA. Tiefes Denken ist nicht ersetzbar
Chatbots & SupportHaiku 4.5Am schnellsten + am günstigsten. Perfekt für Standardantworten
MassenverarbeitungHaiku 4.5Ein Fünftel der Kosten, effizient bei großem Volumen
Claude Code-EntwicklungSonnet 4.6Der Pro-Plan reicht aus. Nur bei komplexer Architektur auf Opus wechseln

Praxistipp

Im Zweifel: Starten Sie mit Sonnet. Es bewältigt die meisten Aufgaben gut. Wechseln Sie nur zu Opus, wenn Sonnets Ausgabequalität nicht ausreicht, und zu Haiku bei einfachen, sich wiederholenden Aufgaben. Dieser abgestufte Ansatz bietet das beste Preis-Leistungs-Verhältnis.

FAQ

Wie groß ist der Leistungsunterschied beim Programmieren zwischen Opus und Sonnet?

Beim SWE-bench Verified (einem Coding-Benchmark) erreicht Opus 4.6 80,8 % und Sonnet 4.6 79,6 % — ein Unterschied von nur 1,2 Punkten. Im Alltag der Programmierung ist der Unterschied kaum spürbar. Angesichts des Preisunterschieds (25 $ vs. 15 $/MTok für Output) bietet Sonnet das bessere Preis-Leistungs-Verhältnis. Bei groß angelegtem Architekturdesign und komplexen Denkaufgaben hat Opus jedoch einen klaren Vorteil.

Ist ein Abo oder die API-Abrechnung nach Verbrauch günstiger?

Bei regelmäßiger Nutzung sind Abonnements deutlich günstiger — etwa 15- bis 30-mal kosteneffizienter als API-Preise. Selbst der Pro-Plan (20 $/Monat) würde bei entsprechender API-Nutzung über 180 $/Monat kosten. API-Preise lohnen sich nur bei sehr seltener Nutzung oder speziellen Batch-Szenarien. Einen Preisvergleich mit ChatGPT finden Sie unter Claude vs. ChatGPT Preisvergleich.

Wie „intelligent" ist Haiku 4.5?

Anthropic beschreibt es als Modell mit „nahezu führender Intelligenz". Obwohl offizielle Benchmarks begrenzt sind, dürfte es bei einfachen Aufgaben wie Textklassifizierung, Zusammenfassungen und Frage-Antwort an die Genauigkeit von Sonnet herankommen. Bei komplexem Denken oder langer Code-Generierung wird der Abstand zu Sonnet/Opus deutlich. Bei einem Fünftel der Kosten glänzt es dort, wo „ausreichende Qualität bei großem Volumen" gefragt ist.

Ist Opus 4.6 günstiger als frühere Opus-Modelle?

Ja, deutlich. Opus 4.1 berechnete 75 $/MTok für Output, Opus 4.6 nur noch 25 $/MTok — eine Preisreduzierung um Faktor 3 bei gleichzeitig besserer Leistung. Das Kontextfenster wurde zudem von 200K auf 1 Million Token erweitert (5-fache Steigerung), was das Preis-Leistungs-Verhältnis erheblich verbessert.