АНАЛІЗ ДИФУЗІЙНИХ МОДЕЛЕЙ ТА ЗАСОБІВ ГЕНЕРУВАННЯ БІОМЕДИЧНИХ ЗОБРАЖЕНЬ

Автор(и)

DOI:

https://doi.org/10.31891/csit-2025-2-1

Ключові слова:

дифузійні моделі, Stable Diffusion, гістопатологія, генерація зображень, біомедичні зображення, методи тонкого налаштування

Анотація

У даному дослідженні розглядається ефективне генерування реалістичних гістопатологічних медичних зображень шляхом тонкого налаштування (донавчання) генеративних дифузійних моделей, що відповідає критичним потребам медичної діагностики, освіти та наукових досліджень. Високоякісні синтетичні зображення гістопатології є важливими для навчання медичних фахівців, розширення обмежених датасетів та потенційного підвищення точності діагностики за допомогою моделей машинного навчання. Водночас, методи генерації загального призначення та обмежена кількість анотованих медичних даних створюють серйозні виклики на шляху до цього.

Було системно оцінено чотири поширені методи тонкого налаштування - LoRA, DreamBooth, Textual Inversion та HyperNetwork - на основі генеративної моделі Stable Diffusion 1.5. Методи оцінювалися на збалансованому датасеті, який містить по 664 зображення для кожного типу тканин: здорові, зубчасті, тканини з присутньою аденокарциномою та аденомою.

Кількісна оцінка із використанням метрик FID, Precision і Recall показала суттєві відмінності між методами. Методи HyperNetwork і DreamBooth стабільно демонстрували вищу якість і варіативність зображень. Зокрема, HyperNetwork досяг найнижчих значень FID (наприклад, 77.27 для аденокарциноми), які супроводжувались високими значеннями Precision і Recall, що у свою чергу свідчить про кращу реалістичність і варіативність. Метод DreamBooth також показав високу ефективність, підтверджуючи його практичну цінність. Textual Inversion навпаки ж показав найгірші результати зі значно вищими показниками  FID (понад 158) і суттєво низькими значеннями Recall, що підкреслює властиві методу обмеження у складних медичних задачах.

Попри цінність кількісної оцінки, традиційні метрики самі по собі не відображають придатність до клінічного застосування, тому залишається необхідною якісна експертна оцінка з боку медичних фахівців. Також актуальною є розробка спеціалізованих метрик та методів тонкого налаштування, адаптованих до біомедичних зображень. Такі рішення мають потенціал суттєво покращити якість синтетичних зображень та забезпечити їхнє впровадження в медичну практику й освіту.

Біографії авторів

Сергій КУЗЬМІН, Національний університет «Львівська політехніка»

Кузьмін Сергій Олександрович - аспірант кафедри “Автоматизованих систем управління”, Національний університет «Львівська політехніка», Львів, Україна.

Олег БЕРЕЗЬКИЙ, Західноукраїнський національний університет

Березький Олег Миколайович - доктор технічних наук, професор, завідувач кафедри Комп’ютерної інженерії. Західноукраїнський національний університет, вул. Львівська, Тернопіль, Україна.

##submission.downloads##

Опубліковано

2025-06-26

Як цитувати

КУЗЬМІН, С., & БЕРЕЗЬКИЙ, О. (2025). АНАЛІЗ ДИФУЗІЙНИХ МОДЕЛЕЙ ТА ЗАСОБІВ ГЕНЕРУВАННЯ БІОМЕДИЧНИХ ЗОБРАЖЕНЬ. Computer Systems and Information Technologies, (2), 8–19. https://doi.org/10.31891/csit-2025-2-1