Перейти до вмісту
ATAI Today Brief
ГоловнаНовиниКонцептиГайдиІнструменти
Про насПідписатисяEN
Підписатися

AI Today Brief

Щоденний бриф з AI-інженерії. Built in public. EN · UA.

XTelegramLinkedInYouTubeRSS
НовиниКонцептиГайдиПідписатисяРекламаПро насРедакційна політикаAI-розкриттяПриватністьУмови

© 2026 AI Today Brief. Усі права захищені.

  1. Головна/
  2. Новини/
  3. Моделі й дослідження/
  4. Ornith-1.0: відкриті моделі із самостійним структуруванням для агентного програмування
Моделі й дослідження

Ornith-1.0: відкриті моделі із самостійним структуруванням для агентного програмування

29 червня 2026 р.· 3 хв читання
OKКуратор Oleksandr Kuzmenko, AI Product Engineer·Оновлено 29 червня 2026 р.·Джерела вказані в кожному матеріалі
За участі AI · перевірено редактором·Як ми використовуємо AI
Ornith-1.0: відкриті моделі із самостійним структуруванням для агентного програмування

Deep Reinforce представила Ornith-1.0 — сімейство моделей (від 9B до 397B параметрів), які самостійно вдосконалюють свої інструкції (скаффолди) для агентного кодингу. Вони демонструють конкурентні результати на бенчмарках для програмування.

Чому це важливо

Це відхід від фіксованих інструкцій, створених людьми, що дозволяє моделям автономно розробляти логіку оркестрації, необхідну для складних завдань програмування.

TL;DR

  • 01Архітектура з самовдосконаленням скаффолда.
  • 02Зменшення залежності від розроблених людьми інструментів тестування.
  • 03Багаторівневий підхід до запобігання хакінгу винагороди.

Спільна еволюція моделі та скаффолда

Ornith-1.0 використовує фреймворк навчання, де допоміжна інфраструктура (скаффолд) еволюціонує разом із політикою. Під час RL модель пропонує скаффолд під завдання, а потім генерує рішення. Винагорода оптимізує як оркестратор, так і виконання, забезпечуючи автономний розвиток стратегій.

Захист від хакінгу винагороди

Для протидії хакінгу винагороди Ornith-1.0 використовує три рівні ізоляції: незмінний зовнішній контур безпеки, детермінований монітор та заморожену модель-суддю, що накладає вето.

#Gemma 4#Qwen 3.5#Terminal-Bench 2.1#SWE-Bench Verified
ПоділитисяПоділитися в XПоділитися в LinkedIn
Наступна новина →Оптимізація токенів у Claude Code через кастомний SQLite-скілл для збереження фідбеку

Схожі матеріали

  • Моделі й дослідженняGLM-5.2: результати тестування відкритої моделі у сфері безпеки
  • Моделі й дослідженняGemini стикається з критикою спільноти щодо стабільності продуктивності моделі

Email-дайджест

Отримуйте ранковий AI-бриф

Один лист на день — історії, що важливі для інженерів, фаундерів і техлідів. Редагує людина, з посиланнями на першоджерела.

  • ✓120+ джерел щодня
  • ✓Редагує людина
  • ✓1 лист на день
  • ✓EN + UA

Підписуючись, ви погоджуєтесь з політикою конфіденційності.