Аналіз критики Джорджа Хотца щодо вартості та ефективності агентів розробки ПЗ
Відомий розробник Джордж Хотц попереджає, що інтеграція автономних ШІ-агентів у процеси розробки є дорогою помилкою через роздуття контексту та нескінченні цикли. Оптимізуйте межі промптів.
Чому це важливо
Ви можете запобігти неконтрольованим витратам на роботу агентів, встановивши суворі ліміти ітерацій та розбиваючи масштабні завдання на простіші промпти.
Хвиля інтересу до впровадження автономних ШІ-агентів, здатних самостійно створювати пулл-реквести та виправляти баги, стикається з дедалі більшим економічним та технічним скептицизмом. Відомий розробник Джордж Хотц нещодавно звернув увагу на критичні проблеми ефективності, попередивши, що сліпе використання агентів у розробці може стати серйозною фінансовою помилкою. Для розробників, які щодня використовують Claude Code або Cursor, розуміння цієї критики є ключовим для побудови вигідних процесів.
Суть критики полягає не в самій здатності великих мовних моделей писати код, а у високій вартості роботи автономних циклів. У типовій архітектурі агент перебуває у постійному циклі: пише код, запускає компілятор або тести, читає помилки, змінює код і повторює це знову. Цей процес часто вимагає десятків ітерацій для вирішення найпростіших архітектурних розбіжностей.
Під капотом така архітектура страждає від експоненціального зростання витрат через специфіку вхідних токенів. Коли агент взаємодіє з терміналом, повний системний промпт, структура файлів та історія викликів інструментів додаються до контекстного вікна кожного нового запиту до LLM. У тривалих циклах обсяг вхідних даних швидко роздувається, що призводить до обробки тисяч повторюваних токенів заради виправлення дрібних помилок. Без жорстких умов виходу агенти часто зациклюються, знову і знову тестуючи зламаний код.
Щоб уникнути цієї фінансової пастки, необхідно змінити підхід до керування інструментами. Замість надання агенту загальних завдань на кшталт "проведи рефакторинг і переконайся, що все працює", розбивайте запити на дрібні ізольовані етапи. Використовуйте фреймворки з детермінованими лімітами, які змушують агента зупинятися та запитувати підтвердження після певної кількості невдалих спроб компіляції.
Цей погляд не означає, що агенти розробки марні, але вказує на їхню високу неефективність при роботі без нагляду з широким колом завдань. Справжня цінність полягає в тісній взаємодії з людиною, де ви виступаєте архітектором, а агент — точним виконавцем.
Розуміючи динаміку споживання токенів в агентних циклах, ви зможете ефективно використовувати такі інструменти, як Claude Code, не наражаючись на великі рахунки за API.
Ключові висновки
- 01Встановлюйте жорсткий ліміт у 3-5 ітерацій для будь-го автономного циклу агента перед запитом підтвердження
- 02Не просіть агентів рефакторити великі бази коду без явного закріплення конкретних файлів у контексті
- 03Контролюйте споживання токенів у реальному часі за допомогою дашбордів кешування промптів