विषय-सूची
- 1. इस माइग्रेशन गाइड का लक्ष्य
- 2. 3 पंक्तियों में सारांश—सबसे कम समय में समझें
- 3. मॉडल नाम का अद्यतन
- 4. ब्रेकिंग चेंज 1: एक्सटेंडेड थिंकिंग समाप्त, एडैप्टिव थिंकिंग की ओर
- 5. ब्रेकिंग चेंज 2: सैंपलिंग पैरामीटर समाप्त
- 6. ब्रेकिंग चेंज 3: सोच कंटेंट डिफ़ॉल्ट से छिपा
- 7. ब्रेकिंग चेंज 4: नया टोकेनाइज़र (लगभग 1.35 गुना)
- 8. ब्रेकिंग चेंज 5: प्रीफ़िल समाप्त
- 9. प्रयास स्तर का चयन (xhigh नया)
- 10. व्यवहार परिवर्तन की प्रतिक्रिया
- 11. अनुशंसित परिवर्तन (अनिवार्य नहीं)
- 12. Opus 4.5/4.1 या पहले से माइग्रेशन
- 13. माइग्रेशन चेकलिस्ट (सभी आइटम)
- 14. स्वचालित माइग्रेशन टूल
- FAQ
1. इस माइग्रेशन गाइड का लक्ष्य
Claude Opus 4.7 के रिलीज़ लेख में प्रस्तुत किया गया कि, Opus 4.7 4.6 का सीधा उत्तराधिकारी मॉडल है। लेकिन, API स्तर पर कई ब्रेकिंग चेंजेज़ साथ जुड़े हैं, और केवल मॉडल नाम बदलने पर 400 Bad Request से गिरने के मामले हैं।
यह लेख निम्नलिखित लोगों के लिए है।
- Anthropic API / SDK उपयोग करके
claude-opus-4-6सीरीज़ कॉल करने वाले डेवलपर - Bedrock / Vertex AI के ज़रिए Claude उपयोग करने वाली टीमें
- Opus 4.5 या 4.1 पर रुके हुए, सीधे 4.7 पर कूदना चाहने वाले
- एक्सटेंडेड थिंकिंग (
thinking: enabled) याtemperatureको प्रोडक्शन में उपयोग करने वाले
Anthropic आधिकारिक माइग्रेशन गाइड को प्राथमिक स्रोत मानते हुए, भारतीय डेवलपमेंट स्थलों पर जहाँ अटकते हैं उन बिंदुओं पर ध्यान देकर व्यवस्थित करेंगे। आधिकारिक जानकारी के लिए platform.claude.com की माइग्रेशन गाइड देखें।
2. 3 पंक्तियों में सारांश—सबसे कम समय में समझें
समय कम हो उनके लिए TL;DR।
- मॉडल नाम
claude-opus-4-6→claude-opus-4-7बदलें (SDK संस्करण भी नवीनतम) - ब्रेकिंग चेंजेज़ मुख्यतः 3: एक्सटेंडेड थिंकिंग
enabledसमाप्त (एडैप्टिव थिंकिंग + effort में),temperature/top_p/top_kसमाप्त, नया टोकेनाइज़र (उसी टेक्स्ट पर अधिकतम 1.35 गुना टोकन) - बदले में मिलने वाला: और उच्च कोडिंग प्रदर्शन, 1M कॉन्टेक्स्ट (मानक मूल्य),
xhighनाम का नया प्रयास स्तर
विवरण अगले अध्यायों में गहराई से देखेंगे।
3. मॉडल नाम का अद्यतन
पहला काम सरल है। मॉडल पहचानकर्ता बदलना ही है।
# Before
model = "claude-opus-4-6"
# After
model = "claude-opus-4-7"
पर्यावरण चर या कॉन्फ़िग फ़ाइल में प्रबंधित करते हैं तो, एक जगह बदलने पर प्रतिबिंबित होने वाली संरचना बना लें, तो अगली बार माइग्रेशन भी आसान होगा।
// .env
// CLAUDE_MODEL=claude-opus-4-6
CLAUDE_MODEL=claude-opus-4-7
// app.ts
const model = process.env.CLAUDE_MODEL ?? "claude-opus-4-7";
लेकिन, केवल मॉडल नाम बदलने से नहीं चलने वाले मामले अधिक हैं, यह इस बार के माइग्रेशन की कठिनाई। नीचे ब्रेकिंग चेंजेज़ एक-एक करके देखते हैं।
4. ब्रेकिंग चेंज 1: एक्सटेंडेड थिंकिंग समाप्त, एडैप्टिव थिंकिंग की ओर
Opus 4.6 में, एक्सटेंडेड थिंकिंग (extended thinking) सक्षम करते समय thinking: {type: "enabled", budget_tokens: N} निर्दिष्ट किया जाता था। 4.7 में यह रूप 400 एरर बनता है।
इसके बदले, मॉडल स्वयं सोच की मात्रा समायोजित करने वाली "एडैप्टिव थिंकिंग (adaptive thinking)" उपयोग होती है। और 4.7 की डिफ़ॉल्ट सोच OFF है, thinking फ़ील्ड छोड़ने पर बिना सोच चलता है। स्पष्ट रूप से ON न करने पर पहले जैसा गहरा तर्क नहीं होगा।
Before (4.6) / After (4.7)
# Before: Opus 4.6
client.messages.create(
model="claude-opus-4-6",
max_tokens=64000,
thinking={"type": "enabled", "budget_tokens": 32000},
messages=[{"role": "user", "content": "..."}],
)
# After: Opus 4.7
client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={"type": "adaptive"},
output_config={"effort": "high"}, # "max", "xhigh", "high", "medium", "low"
messages=[{"role": "user", "content": "..."}],
)
// Before: Opus 4.6
await client.messages.create({
model: "claude-opus-4-6",
max_tokens: 64000,
thinking: { type: "enabled", budget_tokens: 32000 },
messages: [{ role: "user", content: "..." }],
});
// After: Opus 4.7
await client.messages.create({
model: "claude-opus-4-7",
max_tokens: 64000,
thinking: { type: "adaptive" },
output_config: { effort: "high" },
messages: [{ role: "user", content: "..." }],
});
मुख्य बिंदु
budget_tokensसे "सोच मात्रा" सीधे नियंत्रित करने की ज़रूरत नहीं रही- बदले में
output_config.effortसे "कितनी गंभीरता से सोचेगा" निर्दिष्ट करते हैं thinkingफ़ील्ड स्वयं न लगाएँ तो, बिना सोच तुरंत उत्तर (4.6 से व्यवहार बदलता है इस पर ध्यान)
5. ब्रेकिंग चेंज 2: सैंपलिंग पैरामीटर समाप्त
temperature, top_p, top_k में डिफ़ॉल्ट के अलावा मूल्य देने पर 400 एरर बनता है। यह "मॉडल का व्यवहार प्रॉम्प्ट से निर्दिष्ट होना चाहिए" इस Anthropic की नीति का कठोर पालन है।
# Before
client.messages.create(
model="claude-opus-4-6",
temperature=0.7,
top_p=0.9,
top_k=40,
messages=[...],
)
# After
client.messages.create(
model="claude-opus-4-7",
# temperature / top_p / top_k पूरी तरह हटाएँ
messages=[...],
)
पहले temperature=0.2 से "जितना संभव स्थिर आउटपुट" पाने वाले, प्रॉम्प्ट से "आउटपुट एक ही सवाल पर यथासंभव समान हो" स्पष्ट करें, या JSON स्कीमा आदि के structured outputs साथ उपयोग से प्रतिस्थापित करें।
और, temperature=1.2 से "रचनात्मक" निर्दिष्ट करने वाले मामले, प्रॉम्प्ट में "रूपक और अप्रत्याशित अभिव्यक्तियाँ उपयोग करें" जैसे टोन निर्देश डालना अनुशंसित।
6. ब्रेकिंग चेंज 3: सोच कंटेंट डिफ़ॉल्ट से छिपा
4.6 में, सोच सक्षम करने पर डिफ़ॉल्ट रूप से "सारांशित सोच (summarized)" उत्तर स्ट्रीम में बहकर आती थी। अनेक ऐप इसे UI में "सोच रहा है..." के रूप में दिखाते थे।
4.7 में विशिष्टता चुपचाप बदली है, और सोच ब्लॉक उत्तर में दिखाई देता है, लेकिन thinking फ़ील्ड खाली होता है। स्पष्ट रूप से ऑप्ट-इन न करने पर सामग्री वापस नहीं आती।
लक्षण
UI पर "सोच रहा है" इंडिकेटर बहुत देर तक घूमता रहता है, और उत्तर शुरू होने तक अजीब रूप से लंबा महसूस होता है। उपयोगकर्ता से "हैंग हो गया?" कहा जाना इसी पैटर्न का है।
प्रतिक्रिया
# 4.6 की तरह सोच का सारांश UI में बहाना है तो
client.messages.create(
model="claude-opus-4-7",
thinking={
"type": "adaptive",
"display": "summarized", # यह स्पष्ट करें
},
output_config={"effort": "high"},
messages=[...],
)
await client.messages.create({
model: "claude-opus-4-7",
thinking: {
type: "adaptive",
display: "summarized",
},
output_config: { effort: "high" },
messages: [...],
});
बैकएंड प्रोसेसिंग से ही UI में सोच नहीं दिखाना है तो, display न लगाकर छोड़ने में कोई समस्या नहीं।
7. ब्रेकिंग चेंज 4: नया टोकेनाइज़र (लगभग 1.35 गुना)
Opus 4.7 आंतरिक रूप से नया टोकेनाइज़र अपनाता है। प्रदर्शन वृद्धि में योगदान करता है, लेकिन साइड इफ़ेक्ट यह है कि उसी टेक्स्ट के लिए टोकन संख्या 4.6 की तुलना में लगभग 1.0—1.35 गुना बढ़ती है।
यह क्या होने का कारण बनता है।
max_tokensकगार पर डिज़ाइन की गई प्रोसेसिंग बीच में कट जाती है- क्लाइंट की ओर
tiktokenजैसे अनुमान से बिलिंग・लंबाई जाँच विफल /v1/messages/count_tokensके परिणाम 4.7 / 4.6 में भिन्न- उसी प्रॉम्प्ट पर भी लागत और लेटेंसी थोड़ी बढ़ती
प्रतिक्रिया
# Before: 4.6 मानकर 16k tokens का आउटपुट बफ़र
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
messages=[...],
)
# After: 1.35 गुना मानकर मार्जिन रखें
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=22000, # 16000 * 1.35 ≒ 21600 → ऊपर करना
messages=[...],
)
और, 4.7 में 1M कॉन्टेक्स्ट विंडो मानक API मूल्य पर उपलब्ध है (लंबे टेक्स्ट का प्रीमियम नहीं)। टोकन बढ़ने का पहलू है फिर भी, उसके बदले "सब कुछ इनपुट में डालो" रणनीति अपनाना आसान हुआ है।
8. ब्रेकिंग चेंज 5: प्रीफ़िल समाप्त
4.6 से जारी ब्रेकिंग चेंज है। assistant संदेश की प्रीफ़िल—अर्थात् messages ऐरे के अंत में {role: "assistant", content: "```json"} जैसा संदेश डालकर "JSON से शुरू होने वाला उत्तर" मज़बूर करने की तकनीक—400 एरर बनती है।
# Before: प्रीफ़िल से JSON आउटपुट मज़बूर
client.messages.create(
model="claude-opus-4-6",
messages=[
{"role": "user", "content": "उपयोगकर्ता जानकारी JSON में दो"},
{"role": "assistant", "content": "```json\n{"}, # प्रीफ़िल
],
)
# After: structured outputs उपयोग
client.messages.create(
model="claude-opus-4-7",
output_config={
"format": {
"type": "json_schema",
"schema": {
"type": "object",
"properties": {
"name": {"type": "string"},
"age": {"type": "integer"},
},
"required": ["name", "age"],
},
},
},
messages=[
{"role": "user", "content": "उपयोगकर्ता जानकारी JSON में दो"},
],
)
प्रीफ़िल के विकल्प 3 हैं।
- Structured outputs (
output_config.format)—आउटपुट फ़ॉर्मेट को JSON स्कीमा से बाँधना - System प्रॉम्प्ट से "केवल JSON वापस दें, मार्कडाउन या प्रस्तावना बिल्कुल न लिखें" स्पष्ट करें
- Tool use से फ़ंक्शन कॉल के रूप में प्राप्त करें (आर्ग्यूमेंट संरचित JSON बनेगा)
9. प्रयास स्तर का चयन (xhigh नया)
output_config.effort में निर्दिष्ट किए जा सकने वाले मूल्य 5 स्तर हैं। 4.7 में xhigh नया जोड़ा गया है।
| effort | स्थिति | मुख्य उपयोग |
|---|---|---|
| max | सीमा के बिना सोच | बेंचमार्क・कठिन समस्याएँ। लेकिन अत्यधिक सोच का जोखिम, घटती उत्पादकता |
| xhigh (NEW) | कोडिंग / एजेंट अनुकूलित | Claude Code या स्वायत्त कार्यों का मानक यहीं |
| high | संतुलित प्रकार | बौद्धिक रूप से भारी कार्यों की न्यूनतम सीमा |
| medium | लागत प्राथमिकता | थोड़ी बौद्धिक कमी सहकर मूल्य・गति प्राथमिकता |
| low | छोटे निश्चित कार्य | वर्गीकरण・फ़ॉर्मेटिंग・सारांश आदि, लेटेंसी प्राथमिकता |
4.6 के समय budget_tokens हाथ से निर्दिष्ट करने वाले लोगों के लिए भी, 4.7 में effort चुनने से हो जाता है। उपयोग का अनुभवजन्य नियम इस प्रकार।
- कोडिंग एजेंट (Claude Code जैसे उपयोग) तो
xhighसे शुरू - Q&A चैट या RAG उत्तर तो
highसुरक्षित - टैगिंग・JSON निष्कर्षण・वर्गीकरण के हलके वर्कर
mediumयाlow max"एक समस्या पर पैसे की परवाह किए बिना गहरे सोचवाना है" के सीमित उपयोग में
10. व्यवहार परिवर्तन की प्रतिक्रिया
API की दृष्टि से संगत होते हुए भी, प्रॉम्प्ट पर प्रतिक्रिया 4.6 से बदली है कुछ बिंदुओं पर। यह जाने बिना प्रोडक्शन में डालने पर, उपयोगकर्ता से "कुछ शुष्क हो गया" कहा जाता है।
10.1 उत्तर लंबाई कार्य के अनुकूल
4.7 कार्य की जटिलता के अनुसार उत्तर लंबाई स्वचालित समायोजित करता है। "ज़रूर 3 पैराग्राफ़ में लिखो" जैसी निश्चित लंबाई नहीं। इसके विपरीत, मौजूदा "लंबाई नियंत्रण प्रॉम्प्ट" एक बार हटाकर व्यवहार की पुष्टि अनुशंसित।
10.2 निर्देश शब्दशः स्वीकार
विशेष रूप से effort कम होने पर स्पष्ट। "संक्षेप में" लिखें तो वाक़ई संक्षेप में वापस आता है, "3 बताओ" लिखें तो चौथा ख़ुद नहीं जोड़ता। यह गुण सुविधाजनक है, लेकिन अस्पष्ट निर्देशों पर "मौक़ा पढ़कर पूरक" 4.6 जैसा व्यवहार कम हो गया है।
10.3 टोन सीधा
"बढ़िया सवाल है!" जैसी सत्यापन अभिव्यक्तियाँ, सजावटी इमोजी, शुरुआत के अभिवादन कम होते हैं। दोस्ताना लहजा बनाए रखना है तो, system प्रॉम्प्ट से टोन स्पष्ट करें।
10.4 प्रगति अद्यतन एजेंट ट्रैकिंग में अंतर्निहित
एजेंट संचालन में "अभी ○○ करूँगा", "○○ कर रहा हूँ" जैसे मध्यवर्ती प्रगति हाथ से लिखवाने वाला ढाँचा बनाया हो, तो 4.7 यह अंतर्निहित रूप से देता है, इसलिए दोहरा स्कैफ़ोल्डिंग हटा सकते हैं।
10.5 सब-एजेंट और टूल कॉल कम
डिफ़ॉल्ट से सब-एजेंट स्पॉन संख्या कम और टूल कॉल भी कम। "तर्क से हल होता है" समझे तो टूल न दबाकर उत्तर देने की प्रवृत्ति बढ़ी है। एजेंट डिज़ाइन की अपेक्षाएँ अद्यतन करें।
10.6 रियल-टाइम साइबर सुरक्षा सुरक्षा-उपाय
आक्रामक सुरक्षा (रेड टीम, भेद्यता PoC आदि) के वैध कार्य में भी, संदर्भ के अनुसार अस्वीकार मामले हैं। सुरक्षा कार्य प्रोडक्शन उपयोग है तो, Anthropic के साइबर सत्यापन कार्यक्रम (cyber verification program) में आवेदन पर विचार करें।
10.7 उच्च रिज़ॉल्यूशन छवि समर्थन
अधिकतम 2576px तक उच्च रिज़ॉल्यूशन छवि सीधे प्रोसेस कर सकते हैं। लेकिन पूर्ण रिज़ॉल्यूशन छवि प्रति 1 लगभग 3 गुना टोकन ख़र्च करती है। छवि-भारी वर्कलोड में, (a) max_tokens पुनर्वितरण या, (b) भेजने से पहले डाउनसैंपल चुनें।
11. अनुशंसित परिवर्तन (अनिवार्य नहीं)
यहाँ से "न करें तो भी चलता है, लेकिन करने पर लाभ" वाले आइटम हैं।
max_tokensका पुनर्मूल्यांकन: नए टोकेनाइज़र से आउटपुट भी फूलता है, इसलिए मौजूदा मूल्य को 1.2—1.35 गुना से फिर से सत्यापित करें- क्लाइंट की ओर टोकन अनुमान की ऑडिट: बिलिंग गणना या लंबाई जाँच ख़ुद लागू की हो तो,
count_tokensAPI पर झुकाएँ या गुणांक पुनर्विचार करें task_budgets(beta) की शुरुआत: एजेंट संचालन के लिए। हेडरtask-budgets-2026-03-13जोड़ें, न्यूनतम 20k। यह "हार्ड कैप" नहीं, "सलाहकार ऊपरी सीमा" है इस पर ध्यानmax_tokens64k या अधिक:xhigh/maxउपयोग तो, सोच + आउटपुट कुल 64k या अधिक अनुशंसित- छवियों का डाउनसैंपल: उच्च रिज़ॉल्यूशन अनावश्यक हो तो भेजने से पहले छोटा करें, टोकन और लागत बचाएँ
11.1 task_budgets का न्यूनतम सैंपल (आधिकारिक SDK・Python)
task_budgets बीटा सुविधा है, इसलिए client.beta.messages.create एंडपॉइंट उपयोग करें, और betas आर्ग्यूमेंट स्पष्ट करें इस पर ध्यान। प्रोडक्शन GA सुविधा से कॉल करने का तरीक़ा भिन्न है।
response = client.beta.messages.create(
model="claude-opus-4-7",
max_tokens=128000,
output_config={
"effort": "high",
"task_budget": {"type": "tokens", "total": 128000},
},
messages=[
{"role": "user", "content": "Review the codebase and propose a refactor plan."}
],
betas=["task-budgets-2026-03-13"],
)
विशिष्टता के मुख्य बिंदु:
- न्यूनतम मूल्य 20,000 टोकन। इससे कम स्वीकार नहीं
max_tokensप्रति अनुरोध हार्ड कैप (मॉडल को नहीं दिखाता),task_budgetएजेंट लूप समग्र की सलाहकार ऊपरी सीमा (मॉडल काउंटडाउन पहचानता है)- सख़्ती से लागत रोकनी है तो
max_tokens, गुणवत्ता और दक्षता संतुलन चाहिए तोtask_budget - गुणवत्ता > गति के खुले काम में
task_budgetसेट न करें अनुशंसित (अत्यधिक कटौती की प्रवृत्ति आती है)
12. Opus 4.5/4.1 या पहले से माइग्रेशन
4.6 छोड़कर 4.5 या 4.1 से सीधे 4.7 पर बढ़ाने पर, उपरोक्त के साथ निम्न प्रतिक्रिया ज़रूरी।
- सैंपलिंग पैरामीटर हटाना: Claude 3.x से जारी उपयोगकर्ता
temperatureसामान्यतः उपयोग करते होंगे। पूरी तरह हटाएँ - beta हेडरों का प्रबंधन:
effort-2025-11-24,fine-grained-tool-streaming-2025-05-14,interleaved-thinking-2025-05-14आदि पहले ही मुख्य हिस्से में शामिल, इसलिए हटाएँ - एंडपॉइंट स्विच:
client.beta.messages.createसे कॉल किए कोड कोclient.messages.createमें बदलें output_format→output_config.formatकी ओर माइग्रेशन: कुंजी नाम बदला है- टूल आर्ग्यूमेंट पार्सिंग: 4.6 के बाद, JSON एस्केप व्यवहार पहले से भिन्न मामले। कच्ची स्ट्रिंग पार्स के बजाय
JSON.parse/json.loadsआदि औपचारिक पार्सर उपयोग करें
Claude Opus 4.7 की नई सुविधाओं के बारे में, पूर्वगामी लेख Claude Opus 4.7 रिलीज़: नई सुविधाएँ और बेंचमार्क, मूल्य भी साथ देखें।
13. माइग्रेशन चेकलिस्ट (सभी आइटम)
प्रिंट करके टीम में बाँटने के लिए, सभी आइटम एक जगह दिए हैं।
13.1 अनिवार्य (यह न करें तो 400 एरर या व्यवहार टूटना)
- ☐ मॉडल नाम
claude-opus-4-6→claude-opus-4-7अद्यतन - ☐
temperature/top_p/top_kहटाएँ - ☐
thinking: {type: "enabled", budget_tokens: N}को{type: "adaptive"}+output_config.effortसे प्रतिस्थापन - ☐ assistant संदेश की प्रीफ़िल हटाएँ, structured outputs / system प्रॉम्प्ट से प्रतिस्थापन
- ☐ UI में सोच दिखा रहे हों तो
thinking.display: "summarized"स्पष्ट सेट करें
13.2 ट्यूनिंग (लागत・गुणवत्ता अनुकूलन)
- ☐ नए टोकेनाइज़र से लागत और लेटेंसी पुनर्बेंचमार्क
- ☐
max_tokens1.35 गुना मानक से पुनर्समायोजन - ☐ क्लाइंट की ओर टोकन अनुमान प्रोसेसिंग पुनः परीक्षण
- ☐ छवि भेजते हैं तो उच्च रिज़ॉल्यूशन के टोकन पुनर्वितरण
- ☐
xhigh/maxउपयोग तोmax_tokens ≥ 64kसेट - ☐ एजेंट उपयोग तो
task_budgets(beta) की शुरुआत पर विचार
13.3 प्रॉम्प्ट और संचालन पुनर्विचार
- ☐ टेक्स्ट लंबाई अनुकूलन・शब्दशः व्याख्या・टोन परिवर्तन वास्तविक प्रॉम्प्ट से पुष्टि
- ☐ मौजूदा लंबाई नियंत्रण प्रॉम्प्ट हटाएँ, बेसलाइन पुनः माप
- ☐ सुरक्षा कार्य में अस्वीकार हों तो साइबर सत्यापन कार्यक्रम में आवेदन
- ☐ एजेंट का स्कैफ़ोल्डिंग (मध्यवर्ती प्रगति आउटपुट आदि) सरलीकरण
- ☐ 4.5 या पहले से माइग्रेशन के समय beta हेडर हटाना और
client.messages.createकी ओर माइग्रेशन भी
14. स्वचालित माइग्रेशन टूल
Claude Code उपयोग कर रहे हैं तो, Anthropic द्वारा प्रदान Claude API स्किल से यांत्रिक पुनर्लेखन स्वचालित कर सकते हैं। Claude Code की स्किल कॉल में इस तरह निर्देश देना ही है।
/claude-api migrate
पूरे प्रोजेक्ट को Claude Opus 4.6 से 4.7 पर माइग्रेट करें।
- मॉडल नाम बदलें
- temperature / top_p / top_k हटाएँ
- thinking: enabled को adaptive + effort: high से प्रतिस्थापित करें
- प्रीफ़िल शेष हो तो structured outputs में बदलें
स्किल की ओर से रिपॉज़िटरी स्कैन करके, anthropic SDK import करने वाली फ़ाइलें पहचानकर परिवर्तन प्रस्ताव देती है। लेकिन, प्रॉम्प्ट मुख्य भाग के बारीक समायोजन और बेंचमार्क पुनर्माप स्वचालित नहीं कर सकते, इसलिए ज़रूर चेकलिस्ट से पूरा करें।
FAQ
Q. क्या मॉडल नाम बदलने से ही चलेगा?
कोड में temperature, top_p, top_k, thinking: {type: "enabled"}, प्रीफ़िल में से कोई भी उपयोग न किया हो तो, सीधे चलेगा। लेकिन नए टोकेनाइज़र से आउटपुट बीच में कटने की संभावना है, इसलिए max_tokens एक बार देखने की सलाह है।
Q. thinking फ़ील्ड न लगाएँ तो, 4.7 बिना सोचे उत्तर देता है?
हाँ, 4.7 की डिफ़ॉल्ट सोच OFF है। 4.6 में डिफ़ॉल्ट OFF था, वही बात है, लेकिन adaptive स्विच के साथ व्यवहार परिवर्तन स्पष्ट ऑप्ट-इन किए बिना नहीं मिलता। thinking: {type: "adaptive"} लगाएँ, और output_config.effort से तीव्रता निर्दिष्ट करें।
Q. temperature पूरी तरह हटाने पर, हर बार वही आउटपुट मिलेगा?
नहीं, Claude आगे भी संभाव्यता से उत्तर जनरेट करता है, इसलिए उसी प्रॉम्प्ट पर भी कुछ अंतर रहेगा। आउटपुट दृढ़ता से संगत रखना है तो, (a) structured outputs (JSON स्कीमा) से फ़ॉर्मेट बाँधें, (b) प्रॉम्प्ट में "एक ही इनपुट पर एक ही आउटपुट वापस दें", "बुलेट पॉइंट निश्चित क्रम में" आदि स्पष्ट निर्देश डालें, ये उपाय अनुशंसित।
Q. task_budgets हार्ड कैप है?
हार्ड कैप नहीं, मॉडल को "सलाहकार ऊपरी सीमा"। उस दायरे में ज़रूर आएगा यह गारंटी नहीं। सख़्ती से बिलिंग रोकना है तो, पहले की तरह max_tokens और ऐप की ओर टाइमआउट/इंटरप्ट लॉजिक साथ उपयोग करें। beta उपयोग के लिए हेडर task-budgets-2026-03-13 ज़रूरी।
Q. Claude Code की ओर से निर्दिष्ट और API सीधे कॉल में व्यवहार समान है?
API विशिष्टता की दृष्टि से समान है। लेकिन Claude Code में अनुशंसित सेटिंग्स (xhigh कोडिंग का डिफ़ॉल्ट के क़रीब व्यवहार) या, स्किल पर्दे के पीछे task_budgets सेट करने वाले मामले हैं। Claude Code में अनुभव और API सीधे कॉल में अनुभव में अंतर महसूस हो तो, अनुरोध JSON लॉग आउटपुट करके अंतर पुष्टि करना तेज़ है।
Q. छवि-भारी ऐप में टोकन ख़र्च उछल रहा है। उपाय?
(1) भेजने से पहले 2576px से कम डाउनसैंपल, (2) एकाधिक छवियों को एक शीट में एकत्रित, (3) छवि OCR पहले ऐप की ओर से करके केवल टेक्स्ट भेजना, इनमें से कोई विचार करें। उच्च रिज़ॉल्यूशन अनिवार्य उपयोग (चिकित्सा छवि, डिज़ाइन आदि) में केवल पूर्ण रिज़ॉल्यूशन से भेजें, और उस हिस्से के लिए max_tokens ज़्यादा रखना व्यावहारिक संतुलन।
Q. Bedrock / Vertex AI के ज़रिए उपयोग करते हैं, प्रक्रिया समान है?
बुनियादी पैरामीटर परिवर्तन समान है। लेकिन मॉडल पहचानकर्ता (जैसे: Bedrock का anthropic.claude-opus-4-7 सीरीज़) और, प्रत्येक क्लाउड पर सार्वजनिक टाइमिंग प्लेटफ़ॉर्म की घोषणा के अनुसार पालन करें। thinking या output_config की संरचना सभी प्लेटफ़ॉर्मों पर समान है।
Q. स्वचालित माइग्रेशन टूल पर कहाँ तक छोड़ा जा सकता है?
Claude API स्किल (/claude-api migrate) "मॉडल नाम बदलना", "सैंपलिंग पैरामीटर हटाना", "एक्सटेंडेड थिंकिंग का पुनर्लेखन" जैसे यांत्रिक भाग में दक्ष है। दूसरी ओर, प्रॉम्प्ट का लहज़ा・लंबाई नियंत्रण・बेंचमार्क पुनर्मूल्यांकन मानव निर्णय ज़रूरी। स्वचालित माइग्रेशन के बाद, इस लेख की चेकलिस्ट एक-एक पंक्ति से पूरा करना वास्तविक संचालन है।
यह लेख Anthropic आधिकारिक Claude Opus 4.7 माइग्रेशन गाइड (अप्रैल 2026 के समय) पर आधारित है। API विशिष्टता बदलने की संभावना है, इसलिए प्रोडक्शन डालने से पहले आधिकारिक दस्तावेज़ में नवीनतम जानकारी की पुष्टि करें।