ДИНАМІЧНЕ ПРОГРАМУВАННЯ ДЛЯ РІШЕННЯ ЗАВДАННЯ УПРАВЛІННЯ ЗАПАСАМИ У ЛОГІСТИЦІ
DOI:
https://doi.org/10.31891/csit-2024-1-14Ключові слова:
динамічне програмування, навчання з підкріпленням, управління запасами, метод Q-навчання, метод SARSA, паралельна обробка інформаціїАнотація
В даний час існує проблема недостатньої ефективності методів пошуку вирішення задач управління запасами. Об'єктом дослідження є вирішення завдань управління запасами. Предметом дослідження є методи пошуку вирішення завдання управління запасами на основі динамічного програмування. Метою роботи є підвищення ефективності пошуку вирішення задач управління запасами за рахунок динамічного програмування. Для досягнення поставленої мети в роботі були створені: метод на основі детермінованого динамічного програмування, метод на основі динамічного стохастичного програмування, метод на основі Q-навчання, метод на основі SARSA для завдання управління запасами. До переваг запропонованих методів належить наступне. Модифікація методів детермінованого та стохастичного динамічного програмування, Q-навчання та SARSA за рахунок динамічних параметрів дозволяє підвищити швидкість навчання при збереженні середньоквадратичної помилки методу. Проведене чисельне дослідження дозволило оцінити запропоновані методи (для модифікації методів детермінованого та стохастичного динамічного програмування кількість ітерацій близька до кількості етапів, для обох методів детермінованого та стохастичного динамічного програмування середньоквадратична помилка склала 0.02, для модифікації методів Q-навчання та SAR методів Q-навчання та SARSA середньоквадратична помилка склала 0.05). Запропоновані методи дозволяють розширити сферу застосування динамічного програмування, що підтверджується їх адаптацією для завдання управління запасами та сприяє підвищенню ефективності інтелектуальних комп'ютерних систем загального та спеціального призначення. Перспективами подальших досліджень є дослідження запропонованих методів для широкого класу задач штучного інтелекту.