БУСТИНГОВІ МЕТОДИ МАШИННОГО НАВЧАННЯ ДЛЯ ПРОГНОЗУВАННЯ УСПІШНОСТІ ВСТУПУ АБІТУРІЄНТІВ ЗВО УКРАЇНИ
DOI:
https://doi.org/10.31891/csit-2023-1-11Ключові слова:
вступ, абітурієнт, заклад вищої освіти (ЗВО), прогнозування, машинне навчання, бустинг, інформаційна системаАнотація
Існує постійна та зростаюча потреба закладів вищої освіти (ЗВО) у забезпеченні належного та якісного супроводу вступної кампанії за допомогою інформаційних систем та технологій. Тенденції на ринку праці, ненадійність і неякісність джерел), велика кількість правил прийому можуть ускладнити процес вступу абітурієнта. Як наслідок, є ризик того, що абітурієнт не зможе зробити правильний вибір та якісно оцінити шанси на вступ. Тож, у даній роботі розглядається завдання підвищення шансів абітурієнта прийняти ефективне рішення на етапі вибору освітньої програми. Ефективність таких систем значною мірою базується на точності їх інтелектуальних компонентів. У цій статті досліджується ефективність бустингових методів машинного навчання для вирішення проблеми прогнозування вступу за допомогою завдань бінарної класифікації. Ми оцінюємо такі точність роботи таких методів машинного навчання, як Gradient Boosting, Adaptive Boosting (AdaBoost) і eXtreme Gradient Boosting (XGBoost). Для більш детальної оцінки досліджуваних методів також представлено порівняння з методом опорних векторнів і логістичною регресією. Моделювання проводилось за допомогою програмного забезпечення «Orange». Роботу досліджуваних методиів було змодельовано на основі вибірки архівних даних, яка склала 9657 записів даних абітурієнтів денної форми навчання двох навчально-наукових інститутів Національного університету «Львівська політехніка». Вибірку випадковим чином було розподілено на навчальну та тестову вибірки у співвідношенні 80% до 20%. Для забезпечення достовірності отриманого результату роботу кожного з досліджуваних методів піддавали 10-кратній крос-валідації. Для аналізу результатів використано такі показники точності як Classification accuracy (AUC), Precision, Recall, F1 score. Експериментально встановлено, що найвища точність досягається при використанні XGBoost. Отримані результати досить точні. Це дає можливість використовувати досліджувані методи на наступних етапах побудови інформаційної системи підтримки прийняття рішень абітурієнтами.