Остання редакція: 17-04-2021
Тези доповіді
В останні роки сфера беттингу та букмекерства стає все більш популярною у широкого кола прихильників спорту. Аспект прогнозування результатів майбутніх подій є і будуть актуальними для повсякденного життя, спорту, політики, тощо. Ринок спортивного беттингу розвивається з кожним роком все стрімкіше та стрімкіше. Щодня десятки тисяч людей роблять ставки на певні події, користуючись при цьому різними методами оцінки ймовірності. З ростом кількості та якості методів інтелектуального аналізу стала здійсненною ідея прогнозування результатів спортивних подій. У цій справі на поміч приходять різні математичні методи, що допомагають отримати більш точні прогнози результатів, аніж суб‘єктивні прогнози експертів. Над даною проблематикою працювали ряд світових вчених таких як Р. Бабута, Х.Каур, Т. Доразіо, Нтзоуфрас, С. Гуражнел, А. Дістанте, Д.Карліс, І. та інші.
В роботі ж для цілей прогнозування будуть використанні методи машинного навчання. У сьогоденні існує безліч алгоритмів машинного навчання Проте в даній роботі будуть використані та порівняні лише деякі з них. Після певного дослідження робіт вчених, які вже стикалися з подібною проблемою було обрано наступні алгоритми:
- 1-Rule (Rule System)
- Naïve Bayes (Bayesian)
- CART (Decision Tree)
- Back Propagation (Neural Networks).
Першим алгоритмом є 1-Rule - це простий алгоритм, який просто передбачає клас вибірки шляхом пошуку найбільш частого класу для значень об’єкта. 1-Rule є скороченням виразу One Rule. Це означає, що ми використовуємо лише одне правило для цієї класифікації, вибираючи функцію з найкращою продуктивністю. Хоча деякі з пізніших алгоритмів значно складніші, було показано, що цей простий алгоритм має хорошу продуктивність у деяких реальних наборах даних [1].
Другим було обрано алгоритм Naïve Bayes – це інший тип класифікатора, заснований на теоремі Баєса про умовні ймовірності. Він розглядається як спрощена версія класифікатора мережі Байєса, за винятком того, що атрибути обробляються незалежно, вказуючи, що знання значень одного атрибута не впливає на значення інших атрибутів [2].
Наступним є Decision Tree - контрольований метод навчання без параметрів, що використовуються для класифікації та регресії. Метою цього класифікатора є створення моделі, яка здатна передбачити значення цільової змінної шляхом вивчення простих правил прийняття рішень, які визначають надані функції даних [3].
Останнім є Back Propagation. Цей алгоритм неодноразово регулює ваги з'єднань у мережі, щоб мінімізувати міру різниці між фактичним вихідним вектором мережі та бажаним вихідним вектором.
Після етапу імплементації даних алгоритмів мовою Python буде проведено їх порівняння. Для порівняння алгоритмів слугуватимуть дані кількох тисяч матчів зібраних впродовж минулого року.