Логи розширеного мислення у Claude Code є зашифрованими підписами, а не сирим міркуванням
Аналіз локальних логів сесій Claude Code показує, що блоки розширеного мислення зберігаються у вигляді зашифрованих 600-символьних підписів. Локальна система отримує лише спрощене резюме процесу мислення моделі, тоді як справжній ланцюжок міркувань залишається заблокованим Anthropic.
Вплив: Середній
Чому це важливо
Ви не можете покладатися на локальні файли сесій Claude Code для побудови надійних та точних аудиторських слідів поведінки агентів.
TL;DR
- 01Локальні логи Claude Code зберігають міркування у зашифрованому 600-символьному підписі.
- 02Розширене мислення, отримане через API, є спрощеним резюме, а не автентичним слідом.
- 03Нередаговані логи міркувань доступні лише за корпоративними угодами Anthropic.
Ключові факти
- Довжина підпису міркування
- Приблизно 600 символів
- Власник ключа дешифрування
- Anthropic (виключно для корпоративних клієнтів)
Зашифрований бар'єр для міркувань
Коли Claude Code виконує завдання агента на локальній машині, він записує логи сесії на диск. Дослідження цих логів показує, що блоки thinking не містять сирих кроків міркування моделі. Натомість вони містять зашифрований підпис довжиною приблизно 600 символів. Anthropic володіє ключем дешифрування, що означає, що ваша локальна машина ніколи фактично не отримує і не зберігає сирі когнітивні кроки.
Спрощення та втрата даних в API
Згідно з документацією Anthropic для розробників, API повертає резюме процесу мислення Claude, а не повний автентичний ланцюжок. Це означає, що якщо ви спробуєте перевірити результати мислення за допомогою гарячих клавіш на кшталт Ctrl+O в Claude Code, ви побачите спрощене, вже оброблене представлення. Така конвертація призводить до втрати даних, унеможливлюючи реконструкцію точної логіки, яка керувала діями агента під час сесії.
Наслідки для аудиту та розробки
Якщо вам потрібен абсолютний аудиторський слід для комплаєнсу або детермінованого відлагодження, ви не зможете побудувати його за допомогою локальних файлів логів. Хоча ви можете записувати вхідні дані, виходи та дії за допомогою зовнішніх інструментів, реальні когнітивні рішення залишаються прихованими, якщо у вас немає корпоративної угоди, яка надає доступ до нередагованих відповідей API.
Спробуй за 2 хвилини
{
"model": "claude-3-7-sonnet-20250219",
"max_tokens": 4000,
"thinking": {
"type": "enabled",
"budget_tokens": 2048
}
}json
✓ Коли використовувати
- Коли вам потрібно інтерактивно відлагоджувати поведінку агента за допомогою клавіш Ctrl+O.
- Коли високорівневого концептуального резюме логіки агента достатньо для базового дебагу.
Що зробити сьогодні
- Не покладайтеся на локальні файли сесій Claude Code для комплаєнсу або аудиту безпеки.
- Ознайомтеся з офіційною документацією Anthropic щодо обмежень розширеного мислення.
- Розгляньте можливість використання полів 'reasoning' у форматі JSON як дешевшої альтернативи для власних агентів.
Що каже спільнота
“Any explanation that someone gives of their thinking process is necessarily lossy and likely partially confabulated.”
“I've found you get similar results by simply asking most models to return JSON with the first field being 'reason'. Usually it's much more concise as well.”
“Not revealing actual thinking traces prevents model distillation on the actual output (thinking traces are a key part of the output) which makes it harder for competitors to catch up.”
Джерела