Інформаційна технологія автоматизованого синтезу програмного коду на основі засобів штучного інтелекту

Кирило Костянтинович Цехановський

Інтернет-конференції НУБіП України, ТЕОРЕТИЧНІ ТА ПРИКЛАДНІ АСПЕКТИ РОЗРОБКИ КОМП’ЮТЕРНИХ СИСТЕМ '2026

Кирило Костянтинович Цехановський

Остання редакція: 28-04-2026

Тези доповіді

Визначним моментом у розвитку штучного інтелекту та його поширеності серед людства став запуск ChatGPT у листопаді 2022-го року на основі великої мовної моделі GPT-3.5. З цього часу генеративний ШІ став невід’ємною складовою життя та роботи людей. Галузь інформаційних технологій є найбільшим вигодонабувачем від розвитку ШІ, так як отримує прибутки від надання ШІ як сервісу, а його використанні всередині галузі, зокрема для автоматизації рутинних задач з розробки ПЗ, дозволяє зменшити витрати на розробку продуктів та скоротити час їхнього виходу на ринок.

В рамках скорочення витрат на розробку ПЗ, також використовуються інструменти, що передбачають no-code або low-code підхід та дають змогу користувачам без досвіду створення дизайну інтерфейсів та розробки ПЗ створювати нові додатки, інтегрувати їх з існуючими, а також зі сховищами даних. Поєднання LCNC інструментів з генеративним ШІ, за умови, якщо вони компенсують недоліки та підсилюють переваги один одного, надаючи змогу користувачу обирати оптимальні з точки зору фінансів та витраченого часу, підходи для вирішення визначених завдань з розробки ПЗ є одним зі шляхів розвитку даних інструментів.

Станом на сьогодні, поширеними LLM, здатними генерувати програмний код є: GPT від OpenAI, Gemini від Google, Llama від Meta, Claude від Anthropic, Grok від xAI. Задля зручності використання розробниками дані моделі інтегровані в середовища розробки та редактори коду, наприклад Cursor, Antigravity від Google, Visual Studio та Visual Studio Code від Microsoft з використанням GitHub Copilot. Серед LCNC інструментів з підтримкою ШІ можна відзначити Microsoft Power Apps.

Згідно статистики SWE-bench – бенчмарку, який визначає здатність моделей вирішувати реальні задачі для проектів з відкритим вихідним кодом мовою Python, які розміщені на GitHub, який був представлений у статті “Can Language Models Resolve Real-World GitHub Issues?” LLM не завжди повністю спроможні вирішити поставлені задачі [1]. Найбільш широко використовуваним варіантом сьогодні є SWE-bench Verified – підмножина з 500 зразків, перевірених людиною, відібраних за допомогою ретельного процесу анотації за участю 93 розробників програмного забезпечення. Для забезпечення справедливих та послідовних порівнянь стандартний підхід використовує мінімальний набір агентів, що складається лише з інструментів bash. В даному рейтингу наразі представлено 89 моделей зі штучним інтелектом, на першому місці посідає Claude Mythos Preview від Anthropic з результатом 93.9%. Середній бал по всіх моделях становить 64.5% [2]. Фреймворк SWE-Lancer, представлений OpenAI в лютому 2025, розглядає продуктивність LLM в фінансовому вимірі [3]. Він передбачає перевірку на понад 1400 фріланс-завдань з розробки програмного забезпечення з платформи Upwork, загальна вартість яких у реальних виплатах склала 1 мільйон доларів США. Завдання часто вимагають контексту всієї кодової бази, включаючи розробку як для мобільних пристроїв, так і веб-додатків, взаємодію з API, браузерами та зовнішніми додатками. Є завдання, які передбачають написання коду моделлю(IC SWE), а є ті, які передбачають вибір з запропонованих варіантів(SWE Manager), за результатами кожного завдання виконуються E2E тести створені інженерами. Найкраща модель — Claude 3.5 Sonnet — отримує 26,2% балів за завдання IC SWE та 44,9% за завдання SWE Manager, заробляючи загалом 208 050 доларів США з можливих 500 800 доларів США на наборі SWE-Lancer Diamond. Важливим зауваженням є те, що LLM демонструють вищі показники успішності в SWE Manager завданнях порівняно із IC SWE — 56,8% проти 26,2% успішності. Це говорить про доцільність використання LLM як радників щодо якості коду, його продуктивності іноді може бути вищою, ніж їх використання в якості розробників.

Результати даних бенчмарків вказують на те, що попри стрімкий розвиток LLM залишається простір для наукової новизни в питаннях підвищення продуктивності роботи моделей в якості розробників ПЗ.

Одним зі способів інтеграції LLM моделі для роботи з існуючим кодом додатку є написання інструкцій в форматі .md, що, на прикладі VS Code та його інтеграції з GitHub Copilot, передбачає створення файлу .github/copilot-instructions.md де агент(LLM, яка здатна автономно ухвалювати рішення, здійснювати планування) знаходитиме необхідну для розробки інформацію або шляхи для неї. Інструкціями в форматі .md можна створювати різних агентів для роботи в різних модулях та виконання різних задач паралельно. Для забезпечення підтримки LCNC підходу необхідно розгорнути MCP(Model Context Protocol) сервер, який забезпечуватиме зв’язок агента з зовнішньою системою, наприклад Azure DevOps або Jira, де в форматі User Story або дефекту буде описане завдання для моделі, яке вона виконуватиме, коли отримає відповідну команду.

Покращити продуктивність LLM для вирішення конкретних задач можна за допомогою тонкого настроювання та навчання на додаткових даних з використанням різних методів навчання. Для покращення швидкодії без втрати якості та зменшення використання коштів на обробку запитів доступні методи дистиляції та підрізка нейронних мереж.

Формулювання запитів до LLM є запорукою отримання бажаних результатів та оптимізації використання коштів. Для цього застосовують інженерію запитів(prompt engineering), яка полягає у вказанні правильного контексту та формулюванні запитів з метою зменшення використання токенів.

Потенційна наукова новизна може полягати в розробці алгоритмів та методів оптимізації великих LLM для пошуку оптимальних розв’язків задач з програмування реального світу та інтеграція їх в програмний засіб, який слугуватиме для розробки застосунків з використанням LCNC підходів, методів створення інструкцій для моделей в тому числі з використанням інших моделей, методів оптимізації запитів.

Отже, зважаючи на розвиток ШІ та його зростаючу роль в розробці програмного забезпечення в якості акселератора, знаходження методів покращення його роботи для виконання конкретних, іноді вузькоспеціалізованих, задач залишається актуальним з огляду на неможливість великих мовних моделей вирішувати їх ефективно. З огляду на стрімкий розвиток LLM від великих гравців ринку та рішень з вихідним кодом дана тенденція може змінюватися.