КОНСТРУКТИВНО-ПРОДУКЦІЙНЕ МОДЕЛЮВАННЯ ПРИРОДНЬОМОВНИХ ТЕКСТІВ
DOI:
https://doi.org/10.31891/csit-2023-3-10Ключові слова:
природньомовні тексти, конструктивно-продукційне моделювання, встановлення авторства, формальні граматики, стохастические грамматики, моделі текстівАнотація
Розроблені засоби для вирішення задачі встановлення авторства природньомовних текстів. Теоретичні засоби складаються з комплексу конструкторів розроблених на основі конструктивно-продукційного моделювання. Саме ці конструктори представлені в данній роботі. Деякі результати експериментальних досліджень основаних на цьому підході опубліковані в попередніх роботах авторі, основні результати мають бути опубліковані в наступних.
Розроблені конструктори: перетворювач природньомовного тексту на тегований, тегованого тексту у формальну стохастичну граматику та встановлення ступеню схожості стилю авторів двох природньомовних творів за збігом відповідних стохастичних граматик (їх правил підстановки).
Запропонований підхід дозволяє виділити семантичні особливості побудови фраз автором, що є характеристикою його мовлення. Робота з реченням, як із одиницею тексту для аналізу його побудови, дозволить більш точно визначити авторський стиль у частині використання слів, їх послідовностей і характерних мовних конструкцій. Дозволяє не прив'язуватись до конкретних частин мови, а виявляє загальну логіку побудови фраз.