أعلنت شركة أنثروبيك إطلاق نموذج الذكاء الاصطناعي الجديد Claude Sonnet 5 بهدف توفير قدرات متقدمة لتنفيذ المهام الذاتية (Agentic AI) بتكلفة أقل، مع تحسينات كبيرة في الاستدلال، واستخدام الأدوات، والبرمجة، وإنجاز المهام المعقدة.
وأوضحت الشركة أن النموذج الجديد يستطيع التخطيط وتنفيذ المهام بنحو مستقل، مع استخدام أدوات مثل متصفحات الويب والطرفيات (Terminal)، بما يتيح له إتمام أعمال كانت تتطلب قبل أشهر نماذج أكبر وأكثر تكلفة.
منافسة مباشرة مع OpenAI وجوجل
يأتي إطلاق Claude Sonnet 5 في وقت تتسابق فيه شركات الذكاء الاصطناعي على تطوير نماذج قادرة على العمل كوكلاء مستقلين، بعد إطلاق OpenAI نموذج GPT-5.6 Sol، وتقديم جوجل نموذج Gemini 3.5 Flash بقدرات مشابهة تعتمد على التخطيط وتنفيذ المهام بأقل تدخل بشري.
وترى أنثروبيك أن قدرات الوكلاء الأذكياء أصبحت معيارًا أساسيًا في السوق، في حين باتت المنافسة تتركز على خفض التكلفة وتحسين الاعتمادية عند تنفيذ المهام المستقلة.
أداء قريب من Opus 4.8 بتكلفة أقل
أكدت الشركة أن Claude Sonnet 5 يقدم أداءً يقترب من نموذج Opus 4.8 الأعلى فئةً، لكن بسعر أقل بكثير. وأصبح النموذج بدايةً من اليوم الخيار الافتراضي لمستخدمي الخطة المجانية وخطة Pro، كما يتوفر لكافة المشتركين في خدمات Claude.
وتبلغ تكلفة استخدام النموذج حتى نهاية أغسطس دولارين لكل مليون رمز إدخال (Input Tokens) و 10 دولارات لكل مليون رمز إخراج (Output Tokens)، قبل أن ترتفع تكلفة الإدخال إلى 3 دولارات مع بقاء تكلفة الإخراج دون تغيير.
وبهذه الأسعار، يعد Claude Sonnet 5 أقل تكلفةً من Opus 4.8، وكذلك من GPT-5.5 و Gemini 3.1 Pro، في حين يظل أعلى سعرًا من Gemini 3.5 Flash.
تحسينات في البرمجة والاستدلال
أشارت أنثروبيك إلى أن النموذج الجديد يتفوق بوضوح على Sonnet 4.6، الذي أُطلق في فبراير الماضي، في مجالات البرمجة القائمة على الوكلاء، والاستدلال، واستخدام الأدوات، وإنجاز المهام المعرفية.
وحقق Claude Sonnet 5 نسبة قدرها 63.2% في أحد اختبارات البرمجة الذاتية، مقارنةً بـ 58.1% للإصدار السابق، في حين سجل Opus 4.8 نسبة قدرها 69.2%، كما تفوق النموذج الجديد بصورة طفيفة على Opus 4.8 في أحد اختبارات المهام المعرفية.
وأضافت الشركة أن المطورين أصبح بإمكانهم الاختيار بين Sonnet 5 و Opus 4.8 وفق التوازن المطلوب بين الأداء والتكلفة.
ووفقًا لاختبارات أجرتها شركات استخدمت النموذج قبل إطلاقه، فإن Claude Sonnet 5 يتميز بقدرته على إكمال المهام الطويلة والمعقدة حتى النهاية، مع مراجعة نتائجه ذاتيًا دون الحاجة إلى توجيهات إضافية.
تحسينات أمنية
أكدت أنثروبيك أن Claude Sonnet 5 يقدم مستوى أعلى من الأمان مقارنةً بالإصدار السابق، مع انخفاض معدلات السلوكيات غير المرغوبة مثل التعاون مع الاستخدامات الضارة أو الخداع، إضافة إلى قدرة أفضل على رفض الطلبات الخبيثة والتصدي لهجمات حقن الأوامر (Prompt Injection).
وأشارت الشركة إلى انخفاض معدلات الهلوسة الرقمية والميل إلى مجاملة المستخدم على حساب الدقة مقارنةً بنموذج Sonnet 4.6.
ومع ذلك، أوضحت الشركة أن نماذج Opus 4.8 و Claude Mythos Preview ما زالا يتفوقان في التعامل مع بعض سيناريوهات السلامة المعقدة، في حين يمتلك Claude Sonnet 5 قدرة أقل على تنفيذ المهام السيبرانية الخطرة، وهو ما يعد عاملًا إضافيًا لتعزيز سلامته عند استخدامه في التطبيقات العملية.

كسوة الكعبة المشرفة
الفيصل يضخ المياه العذبة ويؤسس للجامعات في محافظات المنطقة / نبراس - إنتصار عبدالله
تصحيح أوضاع 249 ألف برماوي خلال عامين أطلقها الأمير خالد الفيصل عام 1434هـ


