СИСТЕМА АВТОМАТИЧНОГО ПЕРЕКЛАДУ ТЕКСТУ ДЛЯ ШТУЧНИХ МОВ
DOI:
https://doi.org/10.31891/CSIT-2021-5-3Ключові слова:
словник, обробка, модель, текст, мова, сленг, комп’ютерна системаАнотація
Зростання кількості та різноманіття штучних мов призводить до необхідності та актуальності створення автоматичних словників для їх перекладу із метою полегшення людського спілкування. До таких мов відносяться мови, де лексика, фонетика і граматика були спеціально розроблені для втілення певних цілей і спілкування групи людей за інтересами або місцем проживання. Прикладами є сленги та суржики. Спільним для них є те, що для них існує базова мова (літературна), перетин за написанням і значенням слів та словосполучень із якою є досить великий. Метою роботи є створення узагальненої моделі системи автоматичного перекладу текстів з довільної на довільну мови, включаючи штучні та гібридні мови. Запропонована модель показує взаємодію та часткову взаємозалежність модулів створення та коригування словнику та модулю перекладу, що пояснюється підходом зворотнього розповсюдження помилки перекладання. Для виконання експериментів було розроблено програмний застосунок, що включає в себе підпрограму первісної обробки тексту для організації словнику, підпрограму створення робочого словнику, підпрограму двостороннього покращення створеного словнику шляхом доповнення новими текстами для підвищення якості перекладу, включаючи пошук словосполучень, фразеологізмів, та перекладу для них, підпрограму розбиття словника на підсловники при малому відсотку перетину тексту, підпрограму перекладача. Для тестування та аналізу результатів роботи запропонованоузагальненeмодель, використано три типи початкових текстів: художній переклад поезії, художній переклад прози, дослівний переклад прози. Результати показали, що запропонований підхід дає високий рівень перекладу (до 98,8%) для подібних мов (таких, як українська та російська, або українська та українсько-російський суржик із однаковим порядком слів у реченні), особливо при дослівно перекладеному початковому тексті. Стало відомо, що використання художніх текстів для генерації словників можливе, але не є ефективним.