МЕТОД РОЗШИРЕННЯ КЛАСИФІКАТОРА ЗОБРАЖЕНЬ НА ОСНОВІ СТАТИСТИЧНОГО АНАЛІЗУ ТЕКСТОВИХ МЕТАДАНИХ

Автор(и)

DOI:

https://doi.org/10.31891/csit-2025-1-20

Ключові слова:

нейронні мережі, обробка природної мови, машинне навчання, донавчання моделей, класифікація зображень, мультимодальні дані, статистична обробка даних

Анотація

Метою цієї статті є створення нового методу отримання нейронної мережі для класифікації зображень, яка б працювала із класами, приклади для яких не доступні на момент навчання. Задача класифікації зображень передбачає призначення зображенню однієї чи декількох міток на основі об’єктів що присутні на зображенні. Поточний загальноприйнятий спосіб створення подібних нейронних мереж полягає в донавчанні моделей на потрібних даних. Методика дослідження полягає в тому, щоб використовувати існуючі моделі машинного навчання і розширює множину класів, якими оперує модель, проводячи маніпуляції із ваговими коефіцієнтами існуючої моделі-класифікатора. Метод що пропонується використовує текстові метадані про зображення та описи об’єктів, що представляють класи зображень для побудови припущень щодо зв’язки між різними класами зображень. Метод передбачає, за допомогою простих статистичних обчислень на основі текстових даних, на основі існуючих вагів нейронної мережі класифікатора, генерацію додаткових вагів для розпізнавання нових класів об’єктів на зображенні. Результатом дослідження є розробка алгоритму отримання моделі класифікатора, що працює із класом чи класами, не доступними під час навчання. Модель показує результат точності класифікації вищий за базовий випадковий. При цьому, точність класифікації для нових класів, виражена в мірі F-score дорівнює приблизно 0,66, що нижче ніж відповідна міра F-score для класів, що були присутні під час тренування — 0,9. Також, робота висвітлює обмеження статистичного підходу до донавчання моделей, підкреслюючи, що він не є повноцінною заміною власне навчанню. Наукова новизна полягає у розвитку методів розширення моделей-класифікаторів зображень за допомогою статистичного аналізу текстових метаданих. Практична значимість дослідження полягає у двох аспектах. Перший аспект — отримання більш стійкої базової міри якості класифікації для класів що додані до моделей пізніше тим чи іншим методом. Другий аспект — отримання методу розширення класифікатора для випадків коли додаткові дані для донавчання недоступні і сам процес тренування не можливий через брак обчислювальних ресурсів.

##submission.downloads##

Опубліковано

2025-03-27

Як цитувати

ДАШЕНКОВ, Д., & СМЕЛЯКОВ, К. (2025). МЕТОД РОЗШИРЕННЯ КЛАСИФІКАТОРА ЗОБРАЖЕНЬ НА ОСНОВІ СТАТИСТИЧНОГО АНАЛІЗУ ТЕКСТОВИХ МЕТАДАНИХ. Computer Systems and Information Technologies, (1), 171–177. https://doi.org/10.31891/csit-2025-1-20