Anthropic випускає моделі Claude Fable 5 та Claude Mythos 5

Anthropic випустила моделі Fable 5 та Mythos 5, орієнтовані на покращені здібності до логічного виведення та розширені агентні робочі процеси. Ці моделі мають підвищити точність у складних багатоетапних завданнях для розробників.
Вплив: Середній
Чому це важливо
Оцініть ці нові моделі для своїх наявних агентних конвеєрів, щоб перевірити, чи зменшують вони кількість галюцинацій у складних завданнях програмування.
TL;DR
- 01Покращена логіка для багатоетапних агентних завдань
- 02Покращене збереження стану під час тривалих сесій кодування
- 03Більш детальний контроль над обмеженнями виводу моделі
Ключові факти
- Вартість вхідних токенів
- $10 за мільйон токенів
- Вартість вихідних токенів
- $50 за мільйон токенів
- Помилкові спрацьовування захисту
- < 5% сесій
- Масштаб міграції Stripe
- кодова база Ruby на 50 млн рядків
- Прискорення розробки ліків
- приблизно в 10 разів
Прорив у автономних робочих процесах
Claude Fable 5 та Mythos 5 пропонують розширені можливості для тривалих автономних завдань. Під час тестування компанія Stripe використала Fable 5 для міграції кодової бази Ruby обсягом 50 мільйонів рядків всього за один день — завдання, яке зазвичай забирає у цілої команди понад два місяці. Fable 5 також пройшов гру *Pokémon FireRed*, використовуючи лише візуальний інтерфейс, що демонструє передовий рівень комп'ютерного зору.
Передові можливості в науці та біотехнологіях
Claude Mythos 5 створено для спеціалізованого кіберзахисту та наукових процесів. У сфері розробки ліків внутрішні експерти за допомогою Mythos 5 прискорили окремі етапи процесу приблизно в 10 разів, успішно розробивши кандидатів для 9 із 14 білкових мішеней. У геноміці модель автономно навчила власну модель машинного навчання, яка була в 100 разів меншою за модель, опубліковану в журналі *Science*, але перевершила її.
Консервативні обмеження та ціноутворення
Ці моделі пропонуються за ціною $10 за мільйон вхідних токенів та $50 за мільйон вихідних токенів, що є менш ніж половиною вартості Claude Mythos Preview. Для забезпечення безпеки Fable 5 містить консервативні фільтри захисту, які спрацьовують у менш ніж 5% сесій, перенаправляючи складні запити на Claude Opus 4.8.
✓ Коли використовувати
- При побудові складних автономних циклів агентів, що вимагають високої точності керування та стійкого стану.
- При обробці великих обсягів візуальної інформації, наприклад, відтворенні інтерфейсів зі скріншотів.
- При проведенні передових наукових досліджень у геноміці чи молекулярній біології.
✕ Коли НЕ варто
- Коли потрібна максимальна мінімізація витрат, оскільки дешевших старих моделей може бути достатньо.
- Коли розробники не готові миритися з тим, що до 5% запитів перенаправлятимуться на Opus 4.8 через фільтри безпеки.
Що зробити сьогодні
- Оновіть конфігурацію API, вказавши нові ідентифікатори моделей
- Запустіть наявний набір регресійних тестів агентів на Fable 5
Що каже спільнота
“Check your /memory”
Джерела