Перейти до вмісту
ATAI Today Brief
ГоловнаНовиниКонцептиГайдиІнструменти
Про насПідписатисяEN
Підписатися

AI Today Brief

Щоденний бриф з AI-інженерії. Built in public. EN · UA.

XTelegramLinkedInYouTubeRSS
НовиниКонцептиГайдиПідписатисяРекламаПро насРедакційна політикаAI-розкриттяПриватністьУмови

© 2026 AI Today Brief. Усі права захищені.

  1. Головна/
  2. Новини/
  3. Інструменти й релізи/
  4. Dupehound: локальний детермінований детектор дублікатів коду для агентної розробки
Інструменти й релізи

Dupehound: локальний детермінований детектор дублікатів коду для агентної розробки

13 червня 2026 р.· 6 хв читання
OKКуратор Oleksandr Kuzmenko, AI Product Engineer·Оновлено 13 червня 2026 р.·Джерела вказані в кожному матеріалі
За участі AI · перевірено редактором·Як ми використовуємо AI
Інструменти й релізи

Dupehound — це швидкий локальний інтерфейс командного рядка, який використовує сигнатури структур абстрактних синтаксичних дерев для виявлення дубльованих функцій, створених ШІ-агентами. Інтегрувавши його в процеси безперервної інтеграції або передаючи вивід назад у моделі, розробники можуть запобігти розростанню коду.

Вплив: Високий

Чому це важливо

Він вирішує проблему розростання коду через роботу ШІ-агентів повністю локально та детерміновано, без витрачання API-токенів чи використання важких моделей машинного навчання.

TL;DR

  • 01Вирішує проблему розростання ШІ-коду шляхом структурного аналізу абстрактних синтаксичних дерев за допомогою tree-sitter.
  • 02Працює повністю офлайн та детерміновано, скануючи мільйони рядків за лічені секунди (3.6с для VS Code).
  • 03Інтегрується в CI через pre-commit хуки або GitHub Actions для блокування дублікатів у пул-реквестах.
  • 04Передає структурні попередження безпосередньо агентам через CLAUDE.md для повторного використання коду.

Ключові факти

Швидкість сканування (VS Code 2.97M рядків)3.6с на звичайному ноутбуці
Мінімальний ліміт токенів40 нормалізованих токенів на функцію
Підтримувані мови
TypeScript, TSX, JavaScript, Python, Rust, Go, Java, Ruby, Swift
Швидкість сканування (VS Code 2.97M рядків)
3.6с на звичайному ноутбуці
Мінімальний ліміт токенів
40 нормалізованих токенів на функцію
Коди завершення CI
0 чисто, 1 знайдено дублікати, 2 помилка

Структурне та детерміноване порівняння на базі AST

На відміну від текстового пошуку, dupehound ігнорує коментарі, замінює ідентифікатори, рядки та числа на універсальні токени-маркери (sentinels) та аналізує структуру абстрактного синтаксичного дерева. Використовуючи k-грами з 10 токенів, рухомі хеші та алгоритм стійкого просіювання (winnowing), інструмент гарантовано виявляє будь-які спільні послідовності з 17 нормалізованих токенів. Подібність розраховується за допомогою індексу Жаккара, а кластери збігів будуються через структуру систем неперетинних множин.

Команди CLI та інтеграція

Dupehound пропонує три основні команди:

  • dupehound scan [path] сканує директорію, сортує кластери дублікатів за кількістю зайвих рядків та виводить оцінку надлишковості (slop score).
  • dupehound history зчитує об'єкти безпосередньо з бази даних Git без виконання checkout, показуючи, коли саме рівень дублювання почав зростати.
  • dupehound check працює як перевірка в CI або pre-commit хук. Інструмент індексує базову ревізію Git і перевіряє лише додані або змінені функції, повертаючи код 1 у разі виявлення дублікатів.

Спрямування ШІ-агентів на повторне використання коду

Щоб запобігти написанню дублікатів агентами, розробники можуть передавати результати dupehound check прямо у контекст мовних моделей. Додавання звіту або відповідних правил до файлів CLAUDE.md чи AGENTS.md змушує агента дослідити наявну функцію та виконати рефакторинг замість створення нової копії логіки.

Спробуй за 2 хвилини

brew install rafaelpta/dupehound/dupehound
dupehound scan .
dupehound check

bash

✓ Коли використовувати

  • При активній роботі з агентними інтегрованими середовищами розробки, такими як Claude Code, Cursor, або спеціалізованими генераторами коду.
  • Коли потрібен детермінований і відтворюваний механізм перевірки для CI без залежностей від мережі чи API-ключів.
  • При рефакторингу великих застарілих кодових баз, написаних однією з підтримуваних мов.

Що зробити сьогодні

  • →Встановіть dupehound локально через Homebrew: `brew install rafaelpta/dupehound/dupehound`
  • →Запустіть `dupehound scan .` у поточному проєкті, щоб дізнатися рівень надлишковості коду.
  • →Налаштуйте pre-commit хук або GitHub Action за допомогою `dupehound check` для відхилення дубльованої логіки.
  • →Оновіть файли інструкцій `CLAUDE.md` або `AGENTS.md`, щоб агенти враховували звіти перевірки.
#dupehound#Claude Code#Cursor#tree-sitter

Джерела

  • dupehound GitHub Repository
ПоділитисяПоділитися в XПоділитися в LinkedIn

Схожі матеріали

  • Інструменти й релізиMoonshot AI випустила відкриту модель для кодингу Kimi Code K2.7
  • Інструменти й релізиGoogle позивається проти кіберзлочинців через фішингові кампанії з використанням Gemini
  • Інструменти й релізиVisa інтегрувала токенізацію платежів у ChatGPT для безпосередніх покупок через ШІ-агентів
  • Інструменти й релізиOpenRouter збільшує безкоштовний ліміт до 1000 запитів на день

Email-дайджест

Отримуйте ранковий AI-бриф

Один лист на день — історії, що важливі для інженерів, фаундерів і техлідів. Редагує людина, з посиланнями на першоджерела.

  • ✓120+ джерел щодня
  • ✓Редагує людина
  • ✓1 лист на день
  • ✓EN + UA

Підписуючись, ви погоджуєтесь з політикою конфіденційності.