Інтернет-конференції НУБіП України, ТЕОРЕТИЧНІ ТА ПРИКЛАДНІ АСПЕКТИ РОЗРОБКИ КОМП’ЮТЕРНИХ СИСТЕМ '2025

Розмір шрифту: 
ІНТЕЛЕКТУАЛЬНА СИСТЕМА ПО ОБРОБЦІ ТА ПЕРЕКЛАДУ РУКОПИСНОГО ТЕКСТУ
Анастасія Романівна Третяк

Остання редакція: 19-04-2025

Тези доповіді


УДК 004.8

ІНТЕЛЕКТУАЛЬНА СИСТЕМА ПО ОБРОБЦІ ТА ПЕРЕКЛАДУ РУКОПИСНОГО ТЕКСТУ

Третяк А.Р., Науковий керівник - к.ф.-м.н., доцент Кириченко В.В.

В роботі проведено дослідження інтелектуальної системи по обробці та перекладу рукописного тексту є розробити інтелектуальну систему здатну автоматично розпізнавати та перекладати рукописний текст на англійську мову з високою точністю, використовуючи сучасні методи машинного навчання та комп’ютерного зору.

Об’єктом дослідження є розробка алгоритмів які здатні точно розпізнавати символи, слова, за допомогою інтелектуальних інформаційних технологій.

Предметом дослідження є розпізнавання тексту та символів, зокрема нейронні мережі, методи попередньої обробки зображень та адаптивні мовні моделі.

В роботі досліджується програмна модель, яка здатна ефективно розпізнавати тексти. Для її реалізації потрібно розробити:

  • Програмне забезпечення для розпізнавання рукописного тексту;
  • Систему зберігання та обробки даних;
  • Інтерфейс користувача;
  • За необхідності - система повідомлень та управління;

Топологію даної системи показано на рисунку 1.

Системи, що вміють розпізнавати друкарський текст використовуються досить давно та охопили великий набір мов. З рукописним текстом все виявляється набагато складнішим. Засоби, придатні для розпізнавання друкованого тексту виявилися недостатньо коректними для розпізнавання рукописного. Проблема в тому, що класичні методи, у яких розпізнається кожен символ окремо, погано проявляють себе при роботі з довільним рукописним текстом, тому що машині складно зрозуміти, де починається один символ і закінчується інший. В цьому випадку треба використовувати іншу модель розпізнавання: перейшовши від посимвольного розпізнавання тексту до розуміння контексту навколо символу. Інакше кажучи, рукописний текст розпізнається лише на рівні окремих слів, їх невеликих груп чи фрагментів.

Складність навчання моделі для розпізнавання рукописного тексту полягає також у вимаганні великої кількості даних, оскільки варіантів рукописного написання – широке розмаїття – сотні тисяч текстових фрагментів з 1-3 слів. Також потрібно більше часу на розмітку текстів або готових датасетів з ліцензією, що дозволяє комерційне використання.

Ще один важливий нюанс – для досягнення хорошого результату система розпізнавання та мовна модель мають бути щільно інтегровані, оскільки у багатьох випадках вибір між варіантами результату розпізнавання може бути визначений лише з мовного контексту.

Висока точність розпізнавання та перекладу може бути досягнута за рахунок використання глибоких нейронних мереж, для виділення ознак зображення, а також попередньої обробки зображення, яка підвищить якість розпізнавання. А також натреновані моделі на великих дата сетах рукописного тексту, допоможуть досягти точного перекладу, та розпізнавання тексту.

Штучний інтелект для розпізнавання рукописного тексту може бути створений на основі глибокого навчання та нейронних мереж. Ідея полягає у навчанні нейронної мережі на великому наборі даних, що містить зображення рукописних символів та відповідні їм текстові позначки. Нейронна мережа навчатиметься знаходити закономірності в рукописних символах і перетворювати їх у текст.

Процес роботи штучного інтелекту в системі повинен бути наступним:

  1. Підготовка даних: збирання великого набору даних, що містить рукописні символи та відповідні текстові позначки.
  2. Створення нейронної мережі: необхідно створити нейронну мережу, що складається з кількох шарів, здатних аналізувати зображення рукописних символів.
  3. Навчання моделі: нейронна мережа буде навчатися на даних, і процес навчання включатиме оптимізацію ваг і налаштування моделі для розпізнавання рукописного тексту.
  4. Тестування та оцінка: модель буде протестована на наборі даних, який не використовувався у навчанні, для оцінки її точності та здатності розпізнавання рукописного тексту.

Систему створено на мові програмування Python з використанням бібліотеки TensorFlow.

 

 

Рис.1-Топологія системи

В результаті реалізації інтелектуальної системи розпізнавання та перекладу тексу, що функціонує із запропонованим алгоритмом, розпізнаються символи та слова, завдяки використанню нейронних архітектур, які адаптувались до індивідуальних особливостей почерку та умов зображення. А в поєднанні з сучасними алгоритмами перекладу, ми будемо отримувати точний переклад.

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

  1. Alhamad, H.A., Shehab, M., Shambour, M.K.Y., Abu-Hashem,M.A., Abuthawabeh, A., Al-Aqrabi,H., Daoud, M.S., Shannaq, F.B. Handwritten Recognition Techniques: A Comprehensive Review // Symmetry,16(6).https://doi.org/10.3390/sym16060681
  2. Naman Bhardwaj, Pawan Tanay Tripathi, Avinash Sharma.  A Research on Handwritten Text Recognition // International Journal of Scientific Research in Engineering and Management (IJSREM), Volume: 06 Issue: 05, 2022. DOI: 10.55041/IJSREM12649
  3. Тимченко О. В. Нейромережеві методи розпізнавання зображень текстів /О. В. Тимченко, Б. М. Гавриш, Б. В. Дурняк // Поліграфія і видавнича справа. 2021, № 1 (81) – С.72-88.