Інтернет-конференції НУБіП України, ТЕОРЕТИЧНІ ТА ПРИКЛАДНІ АСПЕКТИ РОЗРОБКИ КОМП’ЮТЕРНИХ СИСТЕМ '2026

Розмір шрифту: 
АРХІТЕКТУРА FEDRAG ДЛЯ ГЕНЕРАЦІЇ ВІДПОВІДЕЙ У РОЗПОДІЛЕНИХ СИСТЕМАХ З ГЕТЕРОГЕННИМИ ДАНИМИ
Іван Станіславович Корнілов, Ганна Олександрівна Вайганг

Остання редакція: 28-04-2026

Тези доповіді


Сучасні корпоративні та наукові інформаційні системи оперують даними, що зберігаються у розподілених гетерогенних сховищах: текстові документи, структуровані таблиці та графи знань можуть перебувати на різних вузлах відповідно до вимог регуляторів щодо локалізації (GDPR, HIPAA) або архітектурних рішень. Метод генерації відповідей з підкріпленням пошуком (Retrieval-Augmented Generation, RAG) ефективно зменшує кількість фактичних помилок великих мовних моделей завдяки динамічному доповненню запиту релевантним контекстом із зовнішніх джерел. Огляд Gao та співавторів підтверджує відсутність системних рішень для федеративного RAG з гетерогенними джерелами: класичні підходи передбачають централізований індекс, що практично неможливо у федеративних умовах і суперечить вимогам конфіденційності даних. Мета дослідження – розробити та обґрунтувати метод RAG для федеративних систем, що здійснюють аналіз різнорідних (гетерогенних) даних, із забезпеченням конфіденційності та адаптивності до різних типів джерел. Запропоновано метод FedRAG, що вперше поєднує крос-модальну адаптивну агрегацію контекстів із гарантіями -диференційованої приватності у федеративній задачі пошуку з генерацією відповідей. Метод забезпечує 95,7% якості централізованого підходу при повному збереженні локальності даних. Практична значимість – застосування у корпоративних системах із конфіденційними розподіленими сховищами (медицина, фінанси, державне управління). Наукова новизна полягає у розробці методу FedRAG, що вперше поєднує федеративну архітектуру генерації з підкріпленням пошуком із механізмами крос-модальної адаптивної агрегації та формальними гарантіями диференційованої приватності.