Остання редакція: 17-04-2026
Тези доповіді
Розробка програмного забезпечення (ПЗ) вимагає високого рівня автоматизації для зменшення кількості помилок, скорочення термінів реалізації та підвищення продуктивності розробників. Традиційні інструменти, що підтримують лише окремі аспекти розробки, не забезпечують комплексної інтелектуальної підтримки. Сучасні великі мовні моделі (LLM) відкривають можливість переходу від шаблонної автоматизації до гнучких систем, здатних адаптуватися до конкретних умов проєкту. Проте, існуючі рішення часто не враховують стилістику коду команди та архітектурні патерни, що знижує ефективність їх використання.
У роботі Peng S. [1] показано, що використання GitHub Copilot підвищує продуктивність розробників, проте такі інструменти обмежено враховують контекст проєкту. Дослідження Alenezi M. та Akour M. [2] підкреслюють відсутність повноцінної інтеграції ШІ у всі етапи життєвого циклу ПЗ. Запропоновані підходи багатоагентних систем, зокрема ChatDev та MetaGPT [3], демонструють потенціал колаборативної роботи агентів, однак не забезпечують глибокої адаптації до специфіки проєктів.
Крім того, актуальними залишаються питання донавчання моделей для конкретних доменів та підвищення якості аналізу програмного коду [4, 5]. Це зумовлює необхідність створення комплексних адаптивних систем, що поєднують багатоагентну архітектуру, механізми донавчання та інтелектуальний аналіз коду.
Метою є розробка та експериментальна перевірка методів і технологій використання великих мовних моделей для автоматизації процесів розробки програмного забезпечення, включно з генеруванням коду, документації, тестів, формальних специфікацій і семантичним аналізом.
Методологічну основу роботи становить комбінація теоретичних і емпіричних методів. Теоретичні методи включають аналіз сучасних досліджень, синтез концепцій багатоагентних систем штучного інтелекту та побудову архітектури інтелектуального модуля. Емпіричні методи передбачають експериментальну перевірку функціональності прототипу Smart AI Code Assistant, а також порівняння ефективності різних моделей за метриками точності рефакторингу, часу відповіді та інтегрального показника Score.
Для реалізації дослідження використовувалися мови програмування JavaScript і Python, фреймворк Node.js, система контролю версій Git і середовище розробки Visual Studio Code.
Розроблено модуль у вигляді розширення для VSCode, який реалізує:
- автоматичне генерування документації до коду (Javadoc, docstring тощо);
- створення юніт-тестів із інтеграцією у проєкт;
- аналіз коду на відповідність принципам S.O.L.I.D.;
- рефакторинг і підказки щодо оптимізації структури коду;
- генерування пояснювальних коментарів;
- підтримку вибору та динамічного перемикання між моделями GPT-4o, Claude 3.7 Sonnet, DeepSeek R1, Gemini 2.0 Flash тощо.
Проведено експеримент з рефакторингу JavaScript-класу TaskManager, який містив типові проблеми (неінформативні назви змінних, централізована логіка, дублювання коду). Для інтегральної оцінки ефективності ШІ-моделей було введено метрику Score, яка враховує як точність рефакторингу (successRate), так і середній час відповіді (avgTime). Формула:
, (1)
де k1 = 70 та k2 = 30 визначають вагу точності та швидкодії відповідно.
Рисунок 1 – Порівняльна інтегральна оцінка ефективності ШІ-моделей за результатами експерименту
За результатами 100 запусків кожної моделі (рис. 1), найвищий результат за балансом точності та швидкодії показала модель Gemini 2.0 Flash (Score = 75,51) завдяки поєднанню високої точності (97,75%) і швидкодії (4,24 с). GPT-4o та GPT-3.5-turbo також показали високу ефективність, тоді як Claude 3.7 Sonnet і DeepSeek R1 досягли 100% точності, поступаючись у швидкості.
Запропоновані методи та технології забезпечують підвищення рівня інтелектуалізації процесів розробки ПЗ за рахунок використання LLM. Створений прототип Smart AI Code Assistant підтвердив практичну значущість підходу, продемонструвавши здатність системи ефективно автоматизувати ключові етапи життєвого циклу ПЗ – від написання та документування коду до його тестування й рефакторингу.
Подальші дослідження передбачають розвиток механізмів адаптивного донавчання моделей на основі коду реальних проєктів, що дозволить підвищити релевантність і контекстну точність рекомендацій. Також перспективним напрямом є генерування формальних специфікацій і проведення автоматизованого code review, що забезпечить надійність і верифікованість програмних рішень.
Крім того, планується розширення системи до багатоагентної архітектури ШІ-асистентів, у межах якої окремі агенти виконуватимуть ролі архітектора, розробника та тестувальника, координуючи дії через стандартизовані протоколи взаємодії. Реалізація такого підходу сприятиме створенню комплексних інтелектуальних середовищ, здатних забезпечити повну автоматизацію процесів розробки, тестування та супроводу програмного забезпечення.