Перейти до вмісту
ATAI Today Brief
ГоловнаНовиниКонцептиГайдиІнструменти
Про насПідписатисяEN
Підписатися

AI Today Brief

Щоденний бриф з AI-інженерії. Built in public. EN · UA.

XTelegramLinkedInYouTubeRSS
НовиниКонцептиГайдиПідписатисяРекламаПро насРедакційна політикаAI-розкриттяПриватністьУмови

© 2026 AI Today Brief. Усі права захищені.

  1. Головна/
  2. Новини/
  3. Агенти й MCP/
  4. Чому новіші моделі Anthropic гірше справляються зі строгими схемами виклику інструментів
Агенти й MCP

Чому новіші моделі Anthropic гірше справляються зі строгими схемами виклику інструментів

5 липня 2026 р.· 5 хв читання
OKКуратор Oleksandr Kuzmenko, AI Product Engineer·Оновлено 5 липня 2026 р.·Джерела вказані в кожному матеріалі
За участі AI · перевірено редактором·Як ми використовуємо AI
Чому новіші моделі Anthropic гірше справляються зі строгими схемами виклику інструментів

Новіші моделі, такі як Opus 4.8 та Sonnet 5, припускаються помилок у вкладених аргументах інструментів, вигадуючи зайві ключі. Це погіршення спричинене їхнім донавчанням під Claude Code, клієнт якого автоматично виправляє помилки.

Вплив: Високий

Чому це важливо

Вам потрібно проектувати простіші та плоскіші схеми або впроваджувати гнучкі парсери у ваших фреймворках агентів для запобігання непередбачуваним збоям.

TL;DR

  • 01Нові флагманські моделі оптимізовані під гнучкий клієнт Claude Code, який виправляє дрібні помилки.
  • 02Розробникам агентів варто впровадити толерантне парсування JSON для уникнення збоїв виклику інструментів.
  • 03Видалення блоків міркувань з історії перед викликом інструменту знижує частоту помилок удвічі.

Ключові факти

Частота помилок у довгій історіїБлизько 20%
Ефект видалення блоків міркуваньЗниження помилок на 50%
Моделі під впливом
Claude Opus 4.8, Sonnet 5
Частота помилок у довгій історії
Близько 20%
Ефект видалення блоків міркувань
Зниження помилок на 50%

Пастка вседозволеності Claude Code

Дослідження останніх флагманських моделей Anthropic, включаючи Opus 4.8 та Sonnet 5, виявило несподіване погіршення точності при виклику структурованих інструментів із вкладеними схемами (наприклад, масивом edits[]). Моделі схильні вигадувати додаткові ключі всередині JSON-об'єктів, такі як type, id, kind, unique, matchCase та in_file. Хоча сам контент залишається побайтово правильним, валідація схеми не проходить.

Ця поведінка сильно залежить від контексту. Вона не виникає в поодиноких запитах, але з'являється у довгих логах роботи агентів. Видалення блоків міркувань (thinking blocks) з історії знижує частоту помилок на 50%.

Як Claude Code обробляє неточності

Внутрішній клієнт Claude Code надзвичайно лояльний до помилок моделі. Аналіз його мініфікованого коду показує наступні механізми автокорекції:

  • Виявлення витоку розмітки <invoke> у тексті та автоматичний повтор.
  • Спеціальний кінцевий автомат для обробки некоректних викликів.
  • Відновлення пошкоджених Unicode-послідовностей.
  • Автоматичне мапування аліасів: приймає old_str замість old_string, а також new_str замість new_string.
  • Мовчазне фільтрування неочікуваних ключів без використання суворого режиму валідації.

Оскільки навчання з підкріпленням відбувається у такому середовищі, моделі звикають до того, що клієнт самостійно виправляє їхні помилки.

Спробуй за 2 хвилини

const cleanArgs = (args) => {
  const path = args.path || args.file_path;
  const old_string = args.old_str || args.old_string;
  const new_string = args.new_str || args.new_string;
  return { file_path: path, old_string, new_string };
};

javascript

✓ Коли використовувати

  • При створенні агентних систем, де стійкість виклику інструментів є критично важливою.
  • При переході зі старих моделей Anthropic на нові Opus 4.8 та Sonnet 5.

✕ Коли НЕ варто

  • Не актуально, якщо ваші агенти використовують лише прості текстові відповіді без виклику структурованих інструментів.

Що зробити сьогодні

  • →Спростіть схеми своїх інструментів, зробивши їх максимально плоськими без вкладених об'єктів.
  • →Додайте мовчазне ігнорування невідомих JSON-ключів у свій парсер відповідей агентів.
  • →Вимкніть строгий режим для викликів інструментів Anthropic у разі виникнення помилок складності.
#Claude Code#Claude Opus#Claude Sonnet

Джерела

  • Better Models: Worse Tools
ПоділитисяПоділитися в XПоділитися в LinkedIn
Наступна новина →Як Claude Fable розробив реліз sqlite-utils 4.0rc2 за 150 доларів

Схожі матеріали

  • Агенти й MCPReview-flow: автоматизація 80% рев'ю коду за допомогою Claude Code та Model Context Protocol
  • Агенти й MCPArkon: self-hosted хаб знань та сервер протоколу Model Context Protocol для команд
  • Агенти й MCPApache Magpie пропонує вендор-нейтральні рецепти ШІ-агентів для підтримки репозиторіїв
  • Агенти й MCPСаймон Віллісон випустив llm-coding-agent за допомогою специфікацій у Claude Code

Email-дайджест

Отримуйте ранковий AI-бриф

Один лист на день — історії, що важливі для інженерів, фаундерів і техлідів. Редагує людина, з посиланнями на першоджерела.

  • ✓120+ джерел щодня
  • ✓Редагує людина
  • ✓1 лист на день
  • ✓EN + UA

Підписуючись, ви погоджуєтесь з політикою конфіденційності.