ПОКРАЩЕНА СЕГМЕНТАЦІЯ МАЛИХ СІЛЬСЬКОГОСПОДАРСЬКИХ РОСЛИН НА ОСНОВІ ЗМІНЮВАНОЇ ПІСЛЯ НАВЧАННЯ НЕЙРОННОЇ МЕРЕЖІ
DOI:
https://doi.org/10.31891/csit-2026-1-11Ключові слова:
сегментація зображень бур'янів, видалення бур'янів, точне землеробство, сегментація на пристрої, кордонні обчислення, динамічна нейронна мережа, моніторинг стану посівівАнотація
Точне землеробство дозволяє автоматизовано та на основі даних підвищувати врожайність сільськогосподарських культур. Підживлення ґрунту, обприскування пестицидами проти шкідників і хвороб можна застосовувати у великих масштабах. Однак боротьба з бур'янами є більш проблемною. Потрібна висока точність локалізації бур'янів, оскільки гербіциди вбивають як бур'яни, так і сільськогосподарські культури, зрізання або лазерне видалення також слід виконувати з обережністю. Для видалення бур'янів запропоновано роботизовані пристрої, які використовують нейронні мережі для локалізації бур'янів. Роботи зазвичай виконують обробку на пристрої, без підключення до Інтернету. Як правило, видалення бур’янів має проводитись на початкових етапах зростання, відповідно рослини займають незначну частину зображення, що робить задачу сегментації складною. Існуючі підходи сегментації бур’янів мають недостатнє співвідношення якості та обчислювальної складності для крайових обчислень. Водночас, за оцінками, бур'яни є причиною зниження зборів врожаю на 31,5%. Для вирішення проблеми сегментації бур'янів безпосередньо на пристрої в цій роботі запропоновано нейронну мережу семантичної семегментації PAN+PTA, обчислювальну складність якої може бути відрегульовано після навчання в діапазоні від 13,08 до 18,12 гігафлопс. Таким чином, мережа може ефективно адаптуватися до пристроїв з різними обчислювальними можливостями без повторного навчання, що економить витрати на навчання та розгортання. Ми досягаємо цього шляхом 1) інтеграції мережі Post-Train Adaptive (PTA) як кодувальника в Pyramid Attention Network (PAN); 2) введення множників ширини для конфігурації початкової ємності мережі PTA. Для навчання та оцінки нейронної мережі використано набір даних WE3DS, який містить анотації 7 культур і 10 бур'янів. Найлегша конфігурація PAN+PTA досягає вищого Dice Score порівняно з PAN з кодувальником MobileNetV2, одночасно зменшуючи кількість обчислень у 1,9 рази. Крім того, навчена мережа в важкій конфігурації з множником ширини 1,5 має показник Dice Score 0,5112, а обчислювальна складність може бути відрегульована в межах 32,34%, що є суттєвим поліпшенням порівняно з існуючою мережею U-Net+PTA (Dice Score: 0,4348, діапазон: 3,66%), при цьому зменшуючи гігафлопси, необхідні для виведення, на 80%.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 Ірина УДОВИК, Костянтин ХАБАРЛАК

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
