ҚАЗАҚ–ОРЫС–АҒЫЛШЫН ТІЛДЕРІНДЕГІ СӨЙЛЕУДІ ХАТТАМА ФОРМАТЫНА БЕЙІМДЕЙТІН КӨПТІЛДІ НЕЙРОНДЫҚ МАШИНАЛЫҚ АУДАРМА (NMT) МОДЕЛІ
DOI:
https://doi.org/10.54251/2616-6429.2026.01.0020nuКілт сөздер:
нейрондық машиналық аударма, көптілді модель, сөйлеуді тану, хаттама форматы, трансформер архитектурасы, автоматтандыру, машиналық аудармаАңдатпа
Бұл зерттеу қазақ–орыс–ағылшын тілдік кеңістігінде сөйлеуді автоматты түрде аудару және ресми хаттама форматына бейімдеу мәселелерін жан-жақты қарастырады. Жұмыста трансформер архитектурасына негізделген көптілді нейрондық машиналық аударма (NMT) модельдерінің ғылыми негіздері терең талданады, сонымен қатар оларды автоматты сөйлеуді тану (ASR) жүйелерімен біріктіру әдістері көрсетіледі. Ұсынылған тәсіл аудио сигналдан бастап құрылымдалған ресми құжатқа дейінгі толық өңдеу тізбегін қамтиды, оның ішінде транскрипция, аударма, пост-өңдеу және мәтінді ресми стильге сәйкестендіру кезеңдері бар. Зерттеу нәтижелері көптілді трансформер модельдерінің қазақ, орыс және ағылшын тілдері арасында жоғары сапалы аударма жасауға қабілеттілігін көрсетеді. Сонымен қатар дисфлюэнцияларды жою, пунктуацияны қалпына келтіру, терминологиялық бірізділікті сақтау және мәтінді ресми стильге нормализациялау арқылы мәтінді хаттама форматына автоматты сәйкестендіру мүмкіндігі дәлелденді. Ұсынылған әдіс көптілді жиналыстарды құжаттандыру үдерісін айтарлықтай жеделдетеді, ақпаратты жүйелеуге және қазақ тілінің цифрлық ресурстарын дамытуға оң ықпал етеді.