Довідковий застосунок LlamaIndex legal-kb реалізує пошукову систему для агентів за принципом файлової системи
LlamaIndex випустила legal-kb — довідковий застосунок, який демонструє систему пошуку (Retrieval Harness) для агентів на базі LlamaIndex Index v2. Замість простого одноразового RAG, агенти отримують інструменти на зразок grep та читання файлів для послідовної навігації документами.
Чому це важливо
Перехід від простого RAG до багатокрокового агентного пошуку дозволяє LLM систематично перевіряти, верифікувати та цитувати великі документи з вищою точністю, зменшуючи галюцинації у критичних сферах, таких як юриспруденція та фінанси.
TL;DR
- 01LlamaIndex випустила legal-kb, демонструючи Retrieval Harness у стилі файлової системи для агентів.
- 02Системний промт впроваджує суворий протокол: findFiles, retrieve, а потім readFile/grepFile.
- 03Стек використовує TanStack Start, Vercel AI SDK 6, Prisma, WorkOS та PostgreSQL.
Ключові факти
- Стек
- TanStack Start, AI SDK 6, Prisma, WorkOS, PostgreSQL
- Режими пошуку
- Гібридний семантичний, за ключовими словами, grep на базі регулярних виразів, пошук файлів
- Інтерфейс API
- LlamaIndex Index v2 (LlamaCloud)
Операції файлової системи для ШІ-агентів
Замість одноразового векторного запиту обв'язка legal-kb надає агентам чотири базові інструменти: retrieve, findFiles, readFile та grepFile. Імітуючи термінальні команди, агент може програмно переглядати ієрархію документів, зчитувати конкретні зсуви у файлах за допомогою readFile (через beta.retrieval.read) або шукати шаблони через grepFile на базі регулярних виразів (beta.retrieval.grep).
Структуровані робочі процеси пошуку
Довідковий застосунок використовує системний промт для впровадження суворого протоколу пошуку. Агент зобов'язаний спочатку викликати findFiles для створення списку доступних файлів. Далі він звужує область пошуку за допомогою семантичного запиту, верифікує точні формулювання інструментами читання/грепу і лише після цього формує відповідь із посиланнями. Завантажені файли передаються до LlamaCloud, тоді як відповідні записи створюються в PostgreSQL через Prisma, а фонові процеси синхронізують індекси та версії.
Технологічний стек для розробника
Проект побудовано на базі TanStack Start, Vercel AI SDK 6, Prisma, WorkOS та PostgreSQL з використанням зашифрованих ключів для кожного користувача. Додаток використовує ToolLoopAgent від Vercel AI SDK, що дозволяє розробникам гнучко перемикатися між моделями OpenAI (з середнім рівнем міркування) та Anthropic (з розширеним мисленням) залежно від потреб швидкодії та бюджету.