IДЕНТИФIКАЦIЯ ЗВУКIВ НА ОСНОВI ПЕРЕТВОРЕННЯ ГIЛЬБЕРТА-ХУАНГА ДЛЯ ЗАДАЧІ ВИЯВЛЕННЯ БПЛА

Автор(и)

  • Марія БЄРЄСТОВА Одеський національний університет
  • Володимир МОРОЗ Одеський національний університет https://orcid.org/0000-0002-3240-4590

DOI:

https://doi.org/10.31891/csit-2025-2-15

Ключові слова:

перетворення Гільберта–Хуанга, акустичне виявлення БПЛА, класифікація звуку дрона, MFCC, аналіз нестаціонарних сигналів, полегшені нейронні мережі

Анотація

У роботі досліджується застосування перетворення Гільберта–Хуанга (HHT) для задачі автоматичної ідентифікації акустичних сигнатур безпілотних літальних апаратів (БПЛА) у складному фоні міського середовища. HHT, що поєднує емпіричне модове розкладання та спектральний аналіз Гільберта, обрано через його здатність адаптивно описувати нелінійні та нестаціонарні сигнали, властиві шуму гвинтомоторної групи дронів. Методологія передбачає попередню обробку сирих аудіоданих високочастотним фільтром Баттерворта п’ятого порядку зі зрізом 80 Гц для придушення низькочастотних вібрацій дорожнього руху й вітру. Кожен трисекундний відрізок далі сегментується на 25-мс фрейми з перекриттям 50%, що забезпечує достатню часову роздільну здатність і водночас зберігає стаціонарність усередині вікна. До кожного фрейма застосовується попереднє «вибілювання» шляхом дискретного косинусного перетворення: енергетичний спектр нівелюється, акцентуючи локальні гармоніки пропелерів. Після цього виконується HHT, за підсумком якого формується аналітичний сигнал, чия миттєва частота й амплітуда суттєво покращують виявлення високочастотних мікроструктур. Із модифікованого сигналу обчислюються 13 коефіцієнтів MFCC; для зменшення розмірності та зниження чутливості до випадкових флуктуацій їх усереднюють по всіх фреймах, отримуючи компактний 13-вимірний опис кожного аудіозразка. Експериментальний корпус містить 2 075 семплів класу yes_drone та 266 семплів unknown, записаних з частотою дискретизації 16 кГц. Для навчання використано двошаровий персептрон із 64 та 32 нейронами, що застосовує ReLU-активацію й завершується сигмоїдним вузлом, який генерує ймовірність належності сигналу до класу «дрон». Параметри оптимізовано методом Adam при батч-розмірі 16 та ранній зупинці за валідаційною втратою. На відкладеній тестовій підмножині модель досягає загальної точності 0,95; при цьому показник recall для класу yes_drone дорівнює 0,99, тобто система практично не пропускає реальних БПЛА, а F1-оцінка класу unknown становить 0,78, що свідчить про значне зменшення хибних тривог порівняно з базовим MFCC+SVM-класифікатором. За точністю HHT-підхід наближається до глибоких CNN-моделей, проте суттєво переважає їх за швидкістю й обчислювальною складністю: обробка триває ≈0,15 с на ядро CPU без використання GPU, завдяки чому алгоритм придатний для розгортання на енергообмежених вбудованих цифрових платформах. Додатковий аналіз чутливості показав, що оптимальні параметри фреймування (25 мс / 10 мс) та м’який зріз 80 Гц забезпечують найкращий баланс між виділенням корисних гармонік пропелерів та придушенням фонових коливань. Отримані результати демонструють життєздатність HHT як компактної та ефективної альтернативи ресурсомістким глибоким мережам, відкриваючи шлях до створення легких сенсорних вузлів протидії БПЛА у режимі реального часу. Також виконано порівняння з алгоритмом EEMD+ Hilbert-spectrum statistics.

##submission.downloads##

Опубліковано

2025-06-26

Як цитувати

БЄРЄСТОВА, М., & МОРОЗ, В. (2025). IДЕНТИФIКАЦIЯ ЗВУКIВ НА ОСНОВI ПЕРЕТВОРЕННЯ ГIЛЬБЕРТА-ХУАНГА ДЛЯ ЗАДАЧІ ВИЯВЛЕННЯ БПЛА. Computer Systems and Information Technologies, (2), 132–137. https://doi.org/10.31891/csit-2025-2-15