АНАЛІЗ АЛГОРИТМІВ ПОШУКУ СЛІВ ДЛЯ ЗАСТОСУВАННЯ В СИСТЕМАХ МАШИННОГО ПЕРЕКЛАДУ ШТУЧНИХ МОВ
DOI:
https://doi.org/10.31891/csit-2023-2-2Ключові слова:
переклад, префіксне дерево, словник, штучна мова, хеш, бінарний пошук, дерево пошукуАнотація
Робота присвячена розробці організаційної моделі системи машинного перекладу штучних мов.Головною метою є аналіз алгоритмів пошуку слова в словник, які є значущими елементами розробленої системи машинного перекладу на етапі вдосконалення створених нових словників на основі вже існуючих словників. В ході виконання роботи була розроблена модель системи машинного перекладу, створені словники на основі текстів та на основі вже існуючих словників методами аугментації такими, як зворотній переклад та кросовер; вдосконалено створений словник на основі алгоритмів n-грамм, Кнута-Моріса-Пратта та пошуку слів у тексті (таких, як бінарний пошук, пошук в дереві, пошук в кореневій декомпозиції). Окрім того, в роботі реалізована можливість використання підготовленого словнику для перекладу. Отримані результати можуть покращити існуючі системи машинного перекладу тексту штучних мов. А саме – зменшити час роботи приблизно у 20 разів при переході від алгоритму збалансованого дерева до інших логарифмічних алгоритмів. Практичною значущістю даної роботи є аналіз та покращення алгоритмів аугментації тексту за допомогою алгоритмів бінарного пошуку, хешів, дерева пошуку, кореневої декомпозиції.