ДОСЛІДЖЕННЯ ЕФЕКТИВНОСТІ АРХІТЕКТУР НЕЙРОМЕРЕЖ У КЕРУВАННІ АВТОНОМНИМИ АГЕНТАМИ

Михайло Вячеславович Тищенко

Інтернет-конференції НУБіП України, ТЕОРЕТИЧНІ ТА ПРИКЛАДНІ АСПЕКТИ РОЗРОБКИ КОМП’ЮТЕРНИХ СИСТЕМ '2026

Михайло Вячеславович Тищенко

Остання редакція: 27-04-2026

Тези доповіді

Сучасний етап розвитку інформаційних технологій характеризується стрімким впровадженням систем штучного інтелекту в усі сфери людської діяльності. Одним із найперспективніших та водночас найскладніших напрямків є розробка автономних агентів від безпілотних автомобілів та літальних апаратів до складних промислових роботів. Головним викликом у цій галузі є створення надійних алгоритмів керування, здатних швидко та безпечно приймати рішення в умовах високої невизначеності та динамічної зміни середовища.

Традиційний підхід до навчання та тестування автономних систем у реальних фізичних умовах стикається з низкою критичних обмежень. По-перше, це надзвичайно висока вартість апаратного забезпечення та його обслуговування. По-друге, це ризик пошкодження обладнання або завдання шкоди оточуючим на ранніх етапах навчання моделі. По-третє, збір достатньої кількості даних для навчання у реальному світі може займати місяці або навіть роки. Саме тому використання технології Sim2Real та розробка віртуальних симуляційних середовищ стає безальтернативним галузевим стандартом.

У зв'язку з цим, метою роботи є створення та аналіз комплексної платформи для швидкого, безпечного та стандартизованого порівняння АІ-моделей в однакових умовах. Технологічною базою для реалізації симуляційного середовища виступає сучасний ігровий рушій Unity у поєднанні з інструментарієм ML-Agents SDK. Система дозволяє паралельно реалізовувати та навчати агентів з різними архітектурами, серед яких класичні PPO, SAC та кастомні моделі.

Особлива увага у роботі приділена моделюванню функціональних вимог до розробленої системи за допомогою UML-діаграми прецедентів (Use Case Diagram), яка описує потреби користувачів та деталізує функціональну поведінку системи. Єдиним та ключовим актором у розробленій системі є «Дослідник».

Діаграма прецедентів відображає основні сценарії взаємодії дослідника з платформою, які включають: налаштування симуляційного середовища перед початком експерименту; вибір архітектури нейромережі та запуск навчання; моніторинг метрик ефективності (reward, кількість зіткнень, швидкість) у реальному часі; збереження поточного стану навченого агента для подальшого використання; а також експорт порівняльних результатів у форматах CSV або JSON для зовнішнього аналізу. Крім того, діаграма візуалізує додаткові системні залежності: обов'язкове налаштування гіперпараметрів при виборі архітектури (відношення «include») та можливість запуску inference (тестування без навчання) як розширення процесу збереження/завантаження моделі (відношення «extend»).

Таким чином, запропонована платформа доводить свою практичну цінність та ефективність. Вона формує комплексну ціннісну пропозицію для академічних дослідників та АІ-стартапів: можливість об'єктивно порівнювати моделі, зберігати найкращі стани у форматі .onnx та уникати значних витрат на розробку власної інфраструктури симуляції. Це створює надійне підґрунтя для подальших наукових досліджень у сфері автономного керування.