АНАЛІЗ АЛГОРИТМІВ ПОШУКУ СЛІВ ДЛЯ ЗАСТОСУВАННЯ В СИСТЕМАХ МАШИННОГО ПЕРЕКЛАДУ ШТУЧНИХ МОВ

Автор(и)

  • Олеся Барковська Харківський національний університет радіоелектроніки
  • Антон Гаврашенко Харківський національний університет радіоелектроніки https://orcid.org/0000-0002-8802-0529

DOI:

https://doi.org/10.31891/csit-2023-2-2

Ключові слова:

переклад, префіксне дерево, словник, штучна мова, хеш, бінарний пошук, дерево пошуку

Анотація

Робота присвячена розробці організаційної моделі системи машинного перекладу штучних мов.Головною метою є аналіз алгоритмів пошуку слова в словник, які є значущими елементами розробленої системи машинного перекладу на етапі вдосконалення створених нових словників на основі вже існуючих словників. В ході виконання роботи була розроблена модель системи машинного перекладу, створені  словники на основі текстів та на основі вже існуючих словників методами аугментації такими, як зворотній переклад та кросовер; вдосконалено створений словник на основі  алгоритмів n-грамм, Кнута-Моріса-Пратта та пошуку слів у тексті (таких, як бінарний пошук, пошук в дереві, пошук в кореневій декомпозиції). Окрім того, в роботі реалізована можливість використання підготовленого словнику для перекладу.  Отримані результати можуть покращити існуючі системи машинного перекладу тексту штучних мов. А саме – зменшити час роботи приблизно у 20 разів при переході від алгоритму збалансованого дерева до інших логарифмічних алгоритмів. Практичною значущістю даної роботи є аналіз та покращення алгоритмів аугментації тексту за допомогою алгоритмів бінарного пошуку, хешів, дерева пошуку, кореневої декомпозиції.

##submission.downloads##

Опубліковано

2023-06-29

Як цитувати

Барковська, О., & Гаврашенко, А. (2023). АНАЛІЗ АЛГОРИТМІВ ПОШУКУ СЛІВ ДЛЯ ЗАСТОСУВАННЯ В СИСТЕМАХ МАШИННОГО ПЕРЕКЛАДУ ШТУЧНИХ МОВ. Computer Systems and Information Technologies, (2), 17–24. https://doi.org/10.31891/csit-2023-2-2