جدول المحتويات
- 1. نظرة عامة على الإصدار - متى وماذا والسعر والتوفر
- 2. ملخص المزايا الجديدة
- 3. دعم الصور عالية الدقة - الأول في نماذج Claude
- 4. مستويات الجهد - إضافة xhigh
- 5. ميزانية المهام (بيتا)
- 6. أثر مُحلِّل التوكنز الجديد
- 7. تغير السلوك - ما الذي تغيّر عن 4.6
- 8. التغييرات الجذرية
- 9. المعايير (البنشمارك)
- 10. مقارنة مع Opus 4.6 و 4.5 و 4.1
- 11. متى نستخدمه
- 12. مزايا Claude Code الجديدة - /ultrareview وتوسعة Max
- الأسئلة الشائعة
في 16 أبريل 2026 أطلقت Anthropic رسمياً نموذجها الرائد Claude Opus 4.7. معرّف النموذج claude-opus-4-7، وأسعار الإدخال/الإخراج $5 / $25 لكل MTok دون تغيير عن 4.6. لكن محتواه مليء بـتغييرات تعيد رسم تجربة النموذج الرائد: دعم الصور عالية الدقة، مستوى جهد xhigh جديد، ميزانية المهام (بيتا)، مُحلِّل توكنز جديد.
في المقابل، ثمة تغييرات جذرية كإلغاء API التفكير الموسّع وإلغاء معاملات temperature/top_p/top_k وإلغاء التعبئة المسبقة (prefill)، ما يستلزم ترحيل الكود القائم.
في هذا المقال نشرح - من منظور المهندسين - ما الجديد في 4.7 وما الذي تغيّر عن 4.6 ومتى نستخدمه.
1. نظرة عامة على الإصدار - متى وماذا والسعر والتوفر
| البند | التفاصيل |
|---|---|
| تاريخ الإطلاق | 16 أبريل 2026 |
| معرّف النموذج | claude-opus-4-7 |
| السعر (إدخال) | $5 / مليون توكن (مطابق لـ 4.6) |
| السعر (إخراج) | $25 / مليون توكن (مطابق لـ 4.6) |
| نافذة السياق | 1,000,000 توكن (بسعر API القياسي، دون رسوم إضافية للسياق الطويل) |
| الحد الأقصى للإخراج | 128,000 توكن |
| منصات التوفر | claude.ai و Anthropic API و AWS Bedrock و Google Vertex AI و Microsoft Foundry |
الملفت هو إتاحة "نافذة سياق 1M بالسعر القياسي" دون رفع الأسعار. في نماذج سابقة كانت السياقات الطويلة (فوق 200K) تُحاسب برسوم إضافية، أما 4.7 فيعمل بـ 1M توكن بالسعر العادي.
يمكن للمشتركين في خطط claude.ai المدفوعة استخدام Opus 4.7 مباشرة من الويب أو الموبايل، وعبر API يكفي تحديد معرّف النموذج. متاح أيضاً على AWS Bedrock و Google Vertex AI و Microsoft Foundry، ما يسمح بالاستخدام في البيئات متعددة السحابة بدون تغيير.
2. ملخص المزايا الجديدة
أبرز المزايا المُضافة والمتغيّرة في Opus 4.7:
- دعم الصور عالية الدقة (الأول في Claude) - حتى 2576px / 3.75 ميجابكسل (حوالي 3 أضعاف الحد السابق 1568px / 1.15MP)
- تحسّن الإدراك منخفض المستوى - دقة أعلى في الإشارة والقياس والعدّ وكشف المربعات المحيطة
- مستوى جهد جديد xhigh - بين high و max. مثالي لحالات البرمجة والوكلاء
- ميزانية المهام (بيتا) - ميزة جديدة لتقدير عدد توكنز حلقة الوكيل كاملة مسبقاً
- مُحلِّل توكنز جديد - يستهلك 1.0-1.35 ضعف توكنز السابق (تصل الزيادة إلى 35% حسب المحتوى)
- التفكير التكيفي - تغيّر الافتراضي إلى OFF (يلزم التفعيل الصريح)
- تعزيز الذاكرة المستندة للملفات - تحسّن استخدام دفاتر الملاحظات عبر الجلسات
- تحسين أعمال المعرفة (.docx و.pptx) - تحرير مع تتبع التغييرات وتخطيط الشرائح وتحليل المخططات/الأشكال
- تكامل Claude Code - أمر مائل جديد
/ultrareview، ورفع افتراضي الـ effort في خطة Max إلى xhigh، وتوسيع Auto mode لمستخدمي Max - حماية أمن سيبراني لحظية - سلوك رفض جديد للمواضيع عالية الخطورة
- تغير السلوك - أكثر التزاماً بالتعليمات ونبرة أكثر مباشرة وتقليل استدعاء الأدوات
خصوصاً دعم الصور عالية الدقة ومستوى xhigh تمثّلان قيمة عملية كبيرة لمهام تحليل الوثائق واستخدام الحاسوب (Computer Use) ووكلاء البرمجة. نستعرضها بالترتيب.
3. دعم الصور عالية الدقة - الأول في نماذج Claude
Opus 4.7 هو أول نموذج في سلسلة Claude يتعامل مع الصور عالية الدقة مباشرة.
تغيّر الدقة
| البند | قبل Opus 4.6 | Opus 4.7 |
|---|---|---|
| أقصى دقة (البُعد الأطول) | 1568px | 2576px |
| أقصى عدد بكسلات | 1.15 ميجابكسل | 3.75 ميجابكسل |
| توكنز صورة بالدقة الكاملة | ~1,600 توكن | ~4,784 توكن (3x تقريباً) |
| مقياس الإحداثيات | إحداثيات بكسل بعد التصغير | 1:1 مع البكسل الفعلي (دون تحويل) |
الفائدة العملية
- تحليل الوثائق - قراءة واضحة للنصوص الدقيقة وخطوط الجداول ومقاييس الرسوم في صورة A4 ممسوحة
- Computer Use - فهم مباشر للقطات شاشة بدقة FullHD فأكثر
- فهم لقطات شاشة UI - تحليل لقطات 4K وشاشات DPI عالٍ دون تقليل الدقة
- تطابق إحداثيات 1:1 - عند طلب إحداثيات نقر من النموذج، يسقط منطق تحويل المقاييس ويصبح التنفيذ أبسط
لكن يجب الانتباه إلى أن صورة واحدة بالدقة الكاملة تستهلك ~4,784 توكن. الوكلاء الذين يتبادلون لقطات شاشة كثيرة قد ترتفع تكاليفهم بشكل حاد. عند كفاية الدقة المنخفضة يُستحسن تقليل الدقة مسبقاً.
4. مستويات الجهد - إضافة xhigh
أضيف xhigh كمستوى جديد للتحكم في عمق التفكير الموسّع في Claude "مستوى الجهد (effort level)".
استخدام 5 مستويات
| المستوى | الميزات | الاستخدامات المناسبة |
|---|---|---|
| low | تفكير ضئيل. يركّز على الاستجابة السريعة | أسئلة قصيرة، تصنيف، تلخيص بسيط، رد دردشة |
| medium | استدلال متوسط | QA عادي، استخراج معلومات، مهام توليد خفيفة |
| high | استدلال عميق | قرارات تصميم، تحليل معقد، توليد طويل |
| xhigh (جديد) | بين high و max. مُحسَّن للبرمجة والوكلاء | تنفيذ كود، وكلاء متعدد الخطوات، إعادة هيكلة |
| max | أقصى عمق تفكير | أصعب مسائل الاستدلال، تحليل بمستوى بحثي |
في 4.6 كان هناك فجوة بين "high لا يكفي لكن max مبالغ"، تظهر كثيراً في البرمجة والوكلاء. أُضيف xhigh لملء تلك الفجوة بالضبط، وتصفه Anthropic بأنه مثالي لحالات البرمجة والوكلاء.
نصائح اختيار مستوى الجهد
في 4.7 أصبحت معايرة الجهد (effort calibration) أكثر صرامة، خصوصاً low و medium يميلان إلى "الالتزام الصارم بالنطاق". بمعنى، إن شعرت أن المهمة التي كانت تعمل في medium "قُصّت كثيراً"، فأعد التفكير في الترقية إلى high أو xhigh.
5. ميزانية المهام (بيتا)
في Opus 4.7 أُضيفت ميزة بيتا جديدة اسمها ميزانية المهام (Task Budgets). هي ميزة تقدّم تقديراً تقريبياً لعدد التوكنز المستهلكة في حلقة الوكيل كاملة مسبقاً.
مواصفات ميزانية المهام
- ترويسة بيتا:
task-budgets-2026-03-13 - الحد الأدنى: 20,000 توكن
- النطاق: حلقة الوكيل كاملة شاملة التفكير + استدعاء الأدوات + الإخراج
- السلوك: حد إرشادي (مرجع توجيهي) وليس حداً صارماً - لا يتوقف قسرياً عند التجاوز
لماذا هي ضرورية
max_tokens التقليدي يتحكم فقط بـالحد الأقصى لإخراج استجابة واحدة. لكن في تنفيذ الوكلاء الفعلي، تتشابك توكنز التفكير ودورات الأدوات وإخراج خطوات متعددة، ويصعب تقدير "كم توكن ستستهلك هذه المهمة كاملة".
عند تحديد ميزانية مهام، يستخدمها النموذج كمرجع يخطط على أساسه عمله بعمق وسرعة مناسبين. كأن تقول "لا تتعمق كثيراً وانهِ مبكراً" أو "على العكس فكّر بتأنٍّ"، لتوجيه السياسة من ناحية التكلفة.
لكنها إرشادية، لذا إن أردت إيقاف قطعي عند التجاوز فعليك وضع عدّاد مستقل في جانب التطبيق.
6. أثر مُحلِّل التوكنز الجديد
اعتمد Opus 4.7 مُحلِّل توكنز جديداً، ويستهلك 1.0-1.35 ضعف عدد توكنز السابق لنفس النص. تبلغ الزيادة 35% في حالات قصوى حسب المحتوى.
أثر على ميزانيات التكلفة والسياق
- احتمال زيادة الفاتورة لنفس الموجه - رغم ثبات السعر، ترتفع الفاتورة لأن التوكنز تزيد
- تقلّ فعلياً المعلومات التي تسعها نافذة 1M - 1M توكن يبقى 1M، لكن نفس الوثيقة تستهلك توكنز أكثر
- ضرورة إعادة ضبط التقديرات والتنبيهات - الميزانيات وحدود المعدل المبنية على أعداد توكنز السابقة تتطلب إعادة حساب
التعامل عملياً
عند ترحيل تطبيقات Claude القائمة إلى 4.7 راجع ما يلي:
- توقع التكلفة الشهرية - توقع زيادة قد تصل إلى 35% لنفس حركة المرور
- نسبة استخدام نافذة السياق - العمليات التي كانت "على حافة 1M" تحتاج حذراً
- حدود المعدل وتوكنز/الدقيقة - أعد فحص هامش الأمان مقابل حدود TPM للمؤسسة
- استراتيجية الكاش - قد تتغير نسبة إصابة كاش الموجه
خطوات الترحيل من 4.6 إلى 4.7 نشرحها تفصيلاً في مقال دليل الترحيل.
7. تغير السلوك - ما الذي تغيّر عن 4.6
لم يضف Opus 4.7 مزايا فحسب، بل تغيّر أيضاً أسلوب الإجابة ذاته عن 4.6.
أبرز تغيرات السلوك
- أكثر التزاماً بالتعليمات - خصوصاً في مستويات الجهد المنخفضة والمتوسطة، يميل لتنفيذ التعليمات حرفياً دون إضافات
- نبرة أكثر مباشرة - قلّت عبارات المجاملة ("سؤال رائع"، إلخ) والتعبيرات المبالغة في التأدب والرموز التعبيرية
- طول الاستجابة يتكيف مع المهمة - قصير للأسئلة البسيطة وطويل للمهام المعقدة - لم يعد هناك طول موحّد
- انخفاض عدد استدعاءات الأدوات افتراضياً - يُنهي بالاستدلال ما يكفي للاستدلال، ويتجنب الأدوات غير الضرورية
- تقلّص إطلاق الوكلاء الفرعيين - يفكر بنفسه أولاً بدل التوسع التلقائي للعمل المتوازي
- تشدد معايرة الجهد - في low/medium يحافظ على النطاق بصرامة ويتجنب التفسيرات الموسّعة
الأثر على الموجهات القائمة
الموجهات المصممة على افتراض "سيضيف توضيحاً بلطف" في 4.6 أو الوكلاء المفترض "استخدم الكثير من الأدوات للتحقق"، قد يتغير سلوكها في 4.7.
- إن أردت توضيحات إضافية، اذكر صراحة: "اشرح السبب والبدائل أيضاً"
- إن أردت استخدام أدوات أكثر، اذكر: "استخدم WebSearch للتحقق من الحقائق"
- إن أردت استجابة أطول، اذكر: "على الأقل 500 حرف"
عموماً، هذا تطور نحو "ألا يفعل النموذج ما لا يُطلب منه"، ومع التعليمات الصريحة يعمل كما تريد بالضبط، أي سلوك أكثر توقعية.
حماية الأمن السيبراني والسلامة
في Opus 4.7 اعتُمدت حماية أمن سيبراني لحظية جديدة، وقد تُرفض حالات اختبار الاختراق وأبحاث الثغرات والفرق الحمراء حتى في أعمال الأمن المشروعة حسب السياق. لاستخدامها في الإنتاج للأمن، فكر في التقدم إلى برنامج التحقق السيبراني من Anthropic.
من جهة السلامة، ذكرت Anthropic رسمياً التحسينات التالية:
- تحسن الصدق (honesty) - يقول "لا أعرف" عند الجهل ويتجنب الجزم بلا دليل
- مقاومة أفضل لحقن الموجه - دفاع معزز ضد تعليمات الحقن من أطراف ضارة
- Mythos Preview لا يزال الأفضل حالياً في المحاذاة - Opus 4.7 لديه قدرات أوسع، لكن دقة المحاذاة أعلى في Mythos Preview
على العكس، أُفيد رسمياً بميل لإطالة نصائح تخفيف الضرر بشأن المواد الخاضعة للرقابة. في تشغيل روبوتات الدردشة للصيدلة والطب، من الآمن إضافة تصفية على الإخراج.
8. التغييرات الجذرية
يحتوي Opus 4.7 على عدة تغييرات جذرية مقارنة بـ 4.6. إن كان الكود مكتوباً لـ 4.6، قد يُرجع 400 كما هو.
المعاملات والمزايا الملغاة
| الميزة | السلوك حتى 4.6 | السلوك في 4.7 |
|---|---|---|
| التفكير الموسّع (Extended thinking) | thinking: {type: "enabled", budget_tokens: N} للتفكير الموسّع | خطأ 400 عند إرسال نفس الحمولة. الانتقال إلى التفكير التكيفي |
| التفكير التكيفي | افتراضي ON | افتراضي OFF. التفعيل الصريح عبر thinking: {type: "adaptive"} |
| عرض محتوى التفكير | يُرجع افتراضياً | محذوف (omitted) افتراضياً. للعرض حدد display: "summarized" |
| temperature | قابل للضبط 0.0-1.0 | خطأ 400 لأي قيمة غير الافتراضية |
| top_p / top_k | تحكم في العينات | خطأ 400 لأي قيمة غير الافتراضية |
| التعبئة المسبقة للمساعد | وضع رسالة assistant في مقدمة messages لتوليد التكملة | خطأ 400 (مستمر من 4.6) |
ماذا نصلح
- كود يستخدم التفكير الموسّع: غيّر
thinking.typeإلى"adaptive"وأضفdisplayإن لزم - كود يضبط temperature وأخواتها: احذف هذه المعاملات. للحصول على سلوك حتمي اعتمد على جانب الموجه
- كود يستخدم التعبئة المسبقة: ادمج جزء التعبئة في رسالة المستخدم أو استبدله بتوجيهات تنسيق الإخراج
- UI يعرض محتوى التفكير: انتبه أنه بدون
display: "summarized"لن يُرجَع محتوى التفكير
للطريقة التفصيلية للترحيل راجع مقال دليل الترحيل.
9. المعايير (البنشمارك)
في الإعلان الرسمي كشف عدد محدود من الأرقام، وتعلن Anthropic عن تحسينات كبيرة في مهام البرمجة والوكلاء والرؤية.
مجالات التحسين المعلنة
أرقام البنشمارك الرسمية
أبرز الأرقام من إعلان Anthropic الرسمي:
| البنشمارك | Opus 4.6 | Opus 4.7 | المجال |
|---|---|---|---|
| CursorBench | 58% | 70% | برمجة |
| CursorBench (دقة الرؤية) | 54.5% | 98.5% | فهم لقطات UI |
| Rakuten-SWE-Bench | الخط الأساسي | 3x حل المهام | تغييرات كود إنتاج |
| CyberGym | 73.8 | — (لا بيانات منشورة) | أمن |
| Finance Agent | — | state-of-the-art | وكيل مالي |
| GDPval-AA | — | top-tier | أعمال المعرفة عالية القيمة |
تحسينات من تقارير طرف ثالث ومستخدمين
- بنشمارك برمجة من 93 مهمة: تحسن بـ 13% تقريباً مقابل Opus 4.6
- OfficeQA Pro (استدلال على الوثائق): انخفاض الأخطاء بـ 21% تقريباً
- Factory Droids (مهام إنتاج فعلية): تحسن معدل النجاح بـ 10-15%
تقييم عملي تكميلي
ما سبق نتائج بنشمارك رسمية وشركاء. لكن القياس الفعلي على أحمال عملك هو المؤشر الأوثق. لأن نفس النص يتغير عدد توكنزه مع المُحلِّل الجديد، يكون البنشمارك المسبق للتكلفة والكمون ضرورياً.
نصائح التقييم:
- أرسل نفس المدخل لـ 4.6 و 4.7 وقارن جودة الإخراج والزمن واستهلاك التوكنز
- مهام البرمجة قيّمها موضوعياً بـ "هل عمل من المرة الأولى" و "هل اجتازت الاختبارات"
- مهام الوكلاء بمحورين: "معدل إنجاز المهام" و "عدد استدعاءات الأدوات" (4.7 يقلل الاستدعاءات، فإن ارتفع معدل الإنجاز فهذا تحسن صافٍ)
- مهام الرؤية قارنها في حالات إنتاج صور عالية الدقة (لقطات UI، مسح وثائق)
الموقع النسبي مع Mythos Preview
في الإعلان الرسمي صرّحت Anthropic بأن نموذج "Mythos Preview" غير المنشور لديه حالياً أعلى دقة محاذاة وأدنى معدل أخطاء. Opus 4.7 لديه قدرات أوسع، لكنه ليس بمستوى Mythos Preview في القدرات السيبرانية (سياسة اختبار الإجراءات الأمنية في نموذج أقوى قبل النشر التدريجي). النموذج الرائد المتاح للعموم حالياً هو Opus 4.7.
10. مقارنة مع Opus 4.6 و 4.5 و 4.1
| البند | Opus 4.1 | Opus 4.5 | Opus 4.6 | Opus 4.7 |
|---|---|---|---|---|
| السعر (إدخال) | $15 | $5 | $5 | $5 |
| السعر (إخراج) | $75 | $25 | $25 | $25 |
| أقصى سياق | 200K | 200K | 1M | 1M |
| أقصى إخراج | 32K | 64K | 128K | 128K |
| أقصى دقة صورة | 1568px | 1568px | 1568px | 2576px |
| مستويات الجهد | low/medium/high | low/medium/high/max | low/medium/high/max | low/medium/high/xhigh/max |
| التفكير الموسّع | متوفر | متوفر | تفكير تكيفي | تفكير تكيفي (افتراضي OFF) |
| ميزانية المهام | لا | لا | لا | نعم (بيتا) |
| temperature وغيرها | متاحة | متاحة | متاحة | ملغاة |
| التعبئة المسبقة | متاحة | متاحة | ملغاة | ملغاة |
| مُحلِّل التوكنز | السابق | السابق | السابق | جديد (1.0-1.35x) |
الأرقام بناءً على المعلومات الرسمية في 16 أبريل 2026. أبرز نقاط الانتقال 4.6 ← 4.7 هي تعزيز الميزات مع تثبيت السعر.
11. متى نستخدمه
Opus 4.7 هو النموذج الرائد، لكن ليس الأفضل لكل حالة استخدام.
حالات Opus 4.7 المثالية
- مهام برمجة معقدة - إعادة هيكلة واسعة، قرارات تصميم، تغييرات متعددة الملفات
- حلقات وكيل طويلة - أتمتة متعددة الخطوات، مدمجة مع ميزانية المهام
- مهام رؤية بصور عالية الدقة - Computer Use وتحليل لقطات UI و OCR الوثائق
- معالجة سياق طويل بـ 1M توكن - فهم قواعد كود كبيرة، تحليل وثائق طويلة
- أصعب مسائل الاستدلال - الرياضيات، التحليل البحثي، التخطيط الاستراتيجي
حالات ينبغي التفكير فيها بـ Sonnet
- استجابة QA نمطية، تصنيف، استخراج معلومات
- معالجة دفعية كبيرة بتكلفة منخفضة مع "ذكاء كافٍ"
- تجربة مستخدم لحظية تتطلب أدنى زمن استجابة
حالات ينبغي التفكير فيها بـ Haiku
- تصنيف/ترجمة/تصفية بسيطة بحجم كبير وأقل تكلفة
- IoT وحواف الشبكة، حيث سرعة الاستجابة أولوية قصوى
عملياً، الأفضل تكلفةً وأداءً هو Opus 4.7 للأجزاء المرئية للمستخدم (توليد كود، استدلال معقد، قلب الوكيل)، وSonnet أو Haiku للمعالجة الخلفية الضخمة (تصنيف السجلات، استخراج البيانات، التصفية الأولية).
12. مزايا Claude Code الجديدة - /ultrareview
حُدّث Claude Code (واجهة Anthropic الرسمية) بالتزامن مع إطلاق Opus 4.7، وأُضيف أمر مائل جديد /ultrareview.
مزايا /ultrareview
- تنفيذ مراجعة للكود المُعدَّل بعمق مكافئ لـ xhigh
- ملاحظات أعمق من مراجعة الكود العادية - تشمل قابلية إعادة الاستخدام ومعالجة الأخطاء ومطبات التزامن ومخاطر الأمن
- لا يكتفي بأخطاء التنفيذ، بل يشير إلى "قرارات تصميم غير مستحسنة"
إن كان /review القائم "بمستوى مراجعة PR"، فـ /ultrareview بمستوى مراجعة تصميم من مهندس كبير. مناسب لحظات قبل وبعد ميزة كبيرة أو قبل الإصدار النهائي.
ملاحظة: /ultrareview يستهلك توكنز ووقتاً أكثر من العادي لأنه يستخدم تفكير مكافئ xhigh. الاستخدام الموصى به: /review للتحقق اليومي للـ PRs، و /ultrareview للتحقق عند المنعطفات.
رفع افتراضي الـ effort في خطة Max
رُفع الـ effort الافتراضي إلى xhigh لمستخدمي Claude Code Max عند استخدام Opus 4.7. المهام اليومية التي كانت بـ high تُنفذ الآن باستدلال أعمق. النتيجة أفضل ضمن حدود التوكنز لكن مع زيادة الاستهلاك، لذا يُستحسن المراقبة.
توسيع Auto mode لمستخدمي Max
كان Auto mode مقصوراً على بعض الخطط، والآن يشمل مستخدمي Claude Code Max. ميزة تبدّل تلقائياً بين Opus/Sonnet/Haiku حسب نوع المهمة، لتحسين التكلفة والسرعة معاً.
الأسئلة الشائعة
س. هل يمكن تبديل تطبيق يعمل بـ Opus 4.6 مباشرة إلى 4.7؟
كثير من التطبيقات تعمل بمجرد تغيير معرّف النموذج، لكن إن انطبقت إحدى الحالات التالية فالتعديل لازم: (1) استخدام thinking: {type: "enabled"} للتفكير الموسّع، (2) ضبط temperature/top_p/top_k بقيم غير افتراضية، (3) استخدام التعبئة المسبقة للمساعد، (4) عرض محتوى التفكير في الواجهة. هذه تؤدي إلى خطأ 400 أو تغيّر سلوك. للترحيل التفصيلي راجع مقال دليل الترحيل.
س. هل ترتفع التكلفة فعلاً مع مُحلِّل التوكنز الجديد؟
يستهلك 1.0-1.35 ضعف توكنز السابق لنفس النص، لذا في أسوأ الحالات ارتفاع حوالي 35% في التكلفة. لكن 4.7 يتميز أيضاً بـ "تقليل استدعاءات الأدوات افتراضياً" و "استجابات أكثر إيجازاً"، لذا الأثر الكلي متفاوت حسب التطبيق. يُنصح أن تعمل التطبيقات عالية المرور بالنموذجين جنباً إلى جنب لفترة وقياس التكاليف الشهرية قبل التبديل في الإنتاج.
س. كيف أختار بين xhigh و max؟
تصف Anthropic xhigh بأنه مثالي لحالات البرمجة والوكلاء. أما max فلـ "أصعب مسائل الاستدلال". لمهام التنفيذ وإعادة الهيكلة وإضافة الاختبارات وتخطيط وكلاء متعدد الخطوات، xhigh هو النقطة المُثلى بين الأداء والتكلفة. للمشاكل الرياضية الصعبة والتحليل البحثي والتخطيط الاستراتيجي اختر max. عند الشك ابدأ من xhigh، وإن لم يكفِ ارفع إلى max.
س. لماذا ميزانية المهام ليست حداً صارماً؟
حلقات الوكلاء تشهد استهلاكاً غير متوقع للتوكنز بسبب دورات استدعاء الأدوات. الحد الصارم قد يُنهي المهام على حافة الإنجاز، لذا صممتها Anthropic كحد إرشادي. النموذج يعدّل خطته وفق الميزانية لكنه قد يتجاوزها قليلاً عند الحاجة. للإيقاف القطعي طبّق عدّاداً منفصلاً في التطبيق.
س. هل دعم الصور عالية الدقة يُفعّل تلقائياً؟
بمجرد تحديد معرّف نموذج 4.7، تُعالج الصور المُرسلة حتى 2576px بدون تقليل الدقة. لا يلزم تفعيل خاص. لكن صورة واحدة بالدقة الكاملة تستهلك ~4,784 توكن، والوكلاء الذين يرسلون صوراً كثيرة قد ترتفع تكاليفهم بشكل حاد. تقليل الدقة مسبقاً موصى به لما لا يحتاج دقة عالية.
س. إن لم يعد temperature متاحاً، هل يمكن الحصول على سلوك حتمي؟
في 4.7 أي قيمة غير افتراضية لـ temperature/top_p/top_k تُرجع 400. للسلوك الحتمي اعتمد على جانب الموجه بـتحديد صارم لتنسيق الإخراج (مثل: "أرجِع بصيغة JSON حسب هذا المخطط بدقة"). استخدام تنسيق الإخراج المهيكل (response_format) معاً يرفع الاستقرار أكثر.
س. لماذا محتوى التفكير غير مرئي افتراضياً؟
في 4.7 محتوى التفكير أصبح محذوفاً (omitted) افتراضياً. للعرض حدد display: "summarized". التغيير يعكس توجه "محتوى التفكير جزء من المعالجة الداخلية للنموذج، والاستجابة النهائية هي المُنتج الرئيسي للمستخدم". إن احتجت عرض "ما يفكر فيه" للمستخدم أو لأغراض التنقيح، حدد summarized صراحة.
س. ما الفرق بين /ultrareview و /review في Claude Code؟
/review بمستوى مراجعة PR عادية، يشير إلى جودة الكود والأخطاء والأسلوب. /ultrareview بعمق مكافئ xhigh، يتعمق في مشاكل التصميم ومطبات التزامن ومخاطر الأمن وقابلية إعادة الاستخدام ومعالجة الأخطاء. يستهلك توكنز ووقتاً أكثر لكنه فعّال جداً للفحص النهائي قبل الدمج المهم. اليومي: /review، المنعطفات: /ultrareview.
س. ما حجم التحسن في البنشمارك؟
من تقارير Anthropic الرسمية والشركاء، أبرز الأرقام: CursorBench: 58%→70% (برمجة)، CursorBench دقة الرؤية: 54.5%→98.5% (فهم لقطات UI)، Rakuten-SWE-Bench: 3x حل مهام الإنتاج. تقارير أطراف ثالثة إضافية: تحسن 13% في بنشمارك برمجة من 93 مهمة، و 21% انخفاض أخطاء في OfficeQA Pro، و 10-15% تحسن معدل النجاح في Factory Droids. في Finance Agent و GDPval-AA قُيّم بـ state-of-the-art و top-tier.
س. ما هو Mythos Preview؟ هل هو أقوى من Opus 4.7؟
Mythos Preview نموذج داخلي غير منشور لدى Anthropic. ذكرت Anthropic رسمياً أن "Mythos Preview لديه حالياً أعلى دقة محاذاة وأدنى معدل أخطاء"، لكنه إطلاق مرحلي بقدرات سيبرانية مخفَّضة عمداً. في القدرات العامة، Opus 4.7 هو الأقوى حالياً في النماذج المتاحة للعموم. قد تفوق قدرات Mythos العامة 4.7 جزئياً، لكن توفّره محدود وفق سياسة نشر تدريجي بعد التأكد من السلامة.
س. بدأ يُرفض لي في أعمال الأمن (اختبار اختراق وغيره)، ماذا أفعل؟
اعتُمدت حماية أمن سيبراني لحظية في 4.7، وقد يُرفض في أعمال مشروعة كاختبار الاختراق وأبحاث الثغرات والفرق الحمراء حسب السياق. لمواصلة استخدام الأمن في الإنتاج، تقدّم بطلب برنامج التحقق السيبراني (Cyber Verification Program) من Anthropic للحصول على وصول. عند الموافقة يمكنك الاستخدام بإعدادات أقل تقييداً.
س. أريد أرقام بنشمارك 4.7، أين أجدها؟
الكشف الرسمي للأرقام التفصيلية محدود وقت الإعلان، وتعلن Anthropic عن تحسينات كبيرة في البرمجة والوكلاء والرؤية. لبنشمارك صناعي معياري مثل SWE-bench، انتظار مدونة Anthropic وبطاقة النموذج وتقارير الأطراف الثالثة هو الأسلوب الصحيح. ومع ذلك، يبقى القياس الفعلي على أحمالك أوثق مصدر، لذا يُنصح بمقارنة A/B قبل الإنتاج.
أُعد هذا المقال بناءً على المعلومات الرسمية في 16 أبريل 2026. قد تتغير المواصفات والأسعار ومدى التوفر، لذا تحقق من أحدث التوثيق الرسمي من Anthropic قبل الاستخدام في الإنتاج. للإجراءات التفصيلية للترحيل راجع مقال دليل الترحيل.