مدل «Claude ۴.۶ Opus» معرفی شد

«Claude Opus ۴.۶» نسخه بهروز شده مدلهای خانواده Opus است که پیشتر با تمرکز بر کدنویسی و انجام وظایف دانشبنیان معرفی شده بود. این مدل اکنون میتواند برنامهریزی دقیقتر انجام دهد، وظایف طولانی و پیچیده را مدیریت کند و خطاهای خود را در فرآیند کدنویسی شناسایی و اصلاح کند. علاوه بر این، پنجره متنی یک میلیون توکنی (۱M token context window) امکان پردازش حجم بیشتری از داده و اسناد را فراهم کرده است.
به گزارش Anthropic[2]، نسخه جدید همچنین امکان تشکیل تیمهای عاملی را در محیط Claude Code دارد؛ قابلیتی که وظایف پیچیده را بین چند ایجنت هوشمند تقسیم میکند و هماهنگی تیمی مشابه انسانها ایجاد میکند. این مدل قادر است در Excel و PowerPoint فعالیت کند، دادهها را ساختاربندی کرده و ارائهها را بر اساس اطلاعات پردازششده ایجاد یا ویرایش کند.
«Claude Opus ۴.۶» در تازهترین ارزیابیها توانسته عملکردی در سطح پیشرفته صنعت از خود نشان دهد. این مدل در Terminal-Bench ۲.۰، ارزیابی کدنویسی چندعاملی، بالاترین امتیاز را کسب کرده و در آزمون پیچیده چندرشتهای Humanity’s Last Exam از دیگر مدلهای مطرح پیشی گرفته است. علاوه بر این، در ارزیابی GDPval-AA که توانایی مدلها در انجام کارهای اقتصادی و دانشبنیان سنجیده می شود، Opus ۴.۶ بهطور میانگین ۱۴۴ امتیاز Elo بالاتر از نزدیکترین رقیب خود، GPT-۵.۲ قرار گرفته و فاصله قابل توجهی با نسخههای پیشین ایجاد کرده است.
این مدل توانایی استخراج و پردازش اطلاعات، از مجموعههای بزرگ اسناد را بهبود داده و در وظایف طولانیمدت با حفظ اطلاعات و جزئیات عملکرد بهتری نسبت به نسخه پیشین دارد. با این حال، ایمنی و همراستایی رفتاری مدل حفظ شده است و نرخ خطاهای نامطلوب یا عدم پاسخ به پرسشهای بیخطر در پایینترین حد خود قرار دارد.
Opus ۴.۶ هماکنون از طریق وبسایت claude.ai، API و پلتفرمهای ابری اصلی در دسترس است و کاربران میتوانند از این مدل برای تحلیل مالی، پژوهش، پردازش اسناد، ایجاد صفحات گسترده و ارائهها استفاده کنند. نسخه آزمایشی در PowerPoint و امکانات جدید در Excel، بهرهبرداری از این ابزار را برای کارهای روزمره تسهیل کرده است.
∎[3][4]References
Authors: صاحبخبران - جدیدترین و آخرین اخبار ایران و جهان - علمی-فناوری


