РАЗРАБОТКА ОПТИМАЛЬНЫХ ПРОМПТОВ ДЛЯ МАШИННОГО ПЕРЕВОДА С РУССКОГО НА ВЬЕТНАМСКИЙ В СФЕРЕ МАРКЕТИНГА
Конференция: CCCVIII Студенческая международная научно-практическая конференция «Молодежный научный форум»
Секция: Филология
лауреатов
участников
лауреатов


участников



CCCVIII Студенческая международная научно-практическая конференция «Молодежный научный форум»
РАЗРАБОТКА ОПТИМАЛЬНЫХ ПРОМПТОВ ДЛЯ МАШИННОГО ПЕРЕВОДА С РУССКОГО НА ВЬЕТНАМСКИЙ В СФЕРЕ МАРКЕТИНГА
Появление больших языковых моделей (LLM) открыло новую эру в машинном переводе (МП). Качество перевода с помощью LLM зависит не только от архитектуры модели, но и от точности формулировки входной инструкции – промпта. Как отмечают В.М. Ломшаков и С.И. Николенко, промптинг позволяет «управлять поведением модели для порождения нужных ответов» без необходимости ее переобучения [1, с. 322].
Исследования промпт-инжиниринга сосредоточены на высокоресурсных языковых парах (например, англо-немецкая, англо-китайская), что оставляет пробел в изучении промптов для типологически далеких языков, таких как русский (флективный) и вьетнамский (изолирующий). Стандартные промпты часто игнорируют грамматические и прагматические различия, приводя к буквализмам. Для анализа создан корпус из 200 русскоязычных предложений из рекламных кампаний 2022–2024 гг., разделенный на три домена: телекоммуникации (70 предложений), туризм (70 предложений) и банковские услуги (60 предложений).
Перевод предложений из корпуса выполнялся с использованием четырёх подходов: Google Translate, Yandex Translate, DeepSeek-V2 (базовый промпт) и DeepSeek-V2 (оптимальный промпт). При этом для DeepSeek применялись два варианта промпта: базовый («Переведите на вьетнамский язык: [оригинальный текст]») и оптимизированный промпт, разработанный в рамках настоящего исследования. На основе пилотного исследования и анализа литературы была финализирована следующая пятикомпонентная структура промпта:
<Роль> Вы – профессиональный переводчик и маркетолог, специализирующийся на адаптации российских рекламных кампаний для вьетнамского рынка. <Задача> Перевести следующий рекламный текст с русского на вьетнамский язык. Ваша задача – не дословный перевод, а создание прагматически эквивалентного текста, который будет звучать естественно и убедительно для вьетнамской аудитории. Учтите культурные особенности и маркетинговые конвенции Вьетнама. <Цель перевода> Главная цель – привлечь клиента и мотивировать его к действию. Текст должен быть ясным, привлекательным и вызывать доверие. <Тон> Дружелюбный, но профессиональный; энергичный и позитивный. <Оригинальный текст> «[вставить текст]»
Применялся гибридный подход к оценке:
- Автоматические метрики: BLEU для оценки лексического совпадения с эталоном; COMET (COMET-22) для оценки семантической близости, учитывающей контекст.
- Экспертная оценка: оценивали каждый перевод по шкале штрафных баллов (от 0 до 3) на основе 6 критериев, адаптированных из работ О.В. Максютиной [2] и О.А. Щетининой [3]: 1) Полнота передачи содержания: наличие необоснованных опущений; 2) Степень искажения смысла: грубые смысловые ошибки; 3) Точность терминологии: адекватность перевода маркетинговых и отраслевых терминов; 4) Ясность и естественность выражения: соответствие нормам вьетнамского языка; 5) Смысловая связность (прагматика): соответствие цели и контексту рекламного сообщения; 6) Ориентированность на получателя: культурная адаптация, учёт ожиданий целевой аудитории.
Общий показатель качества (ОПК) рассчитывался как средний процент отсутствия ошибок по всему корпусу. Результаты оценки по всему корпусу сведены в Таблицу 1.
Таблица 1.
Сводные результаты оценки качества перевода
Метод перевода |
BLEU |
COMET |
ОПК |
Google Translate |
28,5 |
0,76 |
61,4% |
Yandex Translate |
29,1 |
0,78 |
64,2% |
DeepSeek (базовый промпт) |
30,5 |
0,81 |
68,5% |
DeepSeek (оптимальный промпт) |
39,2 |
0,91 |
94,7% |
Данные однозначно показывают, что оптимальный промпт обеспечивает существенное улучшение качества перевода по всем метрикам. Разрыв особенно велик в экспертной оценке (ОПК), что подчеркивает способность структурированного промпта решать проблемы, выходящие за рамки лексикосемантического совпадения.
Анализ типичных ошибок и их решение с помощью оптимального промпта
- Проблема 1: Буквальный перевод синтаксических конструкций.
+ Пример (Банки): «Откройте вклад и получите уверенность в завтрашнем дне».
+ Базовый промпт: Mở một khoản tiền gửi và nhận được sự tự tin vào ngày mai. (Буквализм, «уверенность в завтрашнем дне» звучит неестественно).
+ Оптимальный промпт: Gửi tiết kiệm ngay hôm nay để vững tâm cho tương lai. (Идиоматичный перевод: «уверенность» заменена на «vững tâm» – спокойствие духа, «завтрашний день» на «tương lai» – будущее, что является прагматическим эквивалентом в финансовом контексте).
Компонент промпта «Задача», требующий «прагматически эквивалентного текста», побудил модель отойти от синтаксического копирования и найти функциональный аналог во вьетнамском языке.
Проблема 2: Неадекватный перевод маркетинговой лексики.
+ Пример (Телеком): «Наши предложения охватывают направления вызовов со льготами в 20 стран мира».
+ Google Translate: Ưu đãi của chúng tôi bao gồm các điểm đến cuộc gọi... («điểm đến cuộc gọi» – букв. «пункты назначения звонков», туристический оттенок).
+ Оптимальный промпт: Chúng tôi cung cấp gói cước quốc tế ưu đãi đến 20 quốc gia. (Использован точный отраслевой термин «gói cước quốc tế» – международный тарифный план).
Компонент «Роль» («переводчик и маркетолог») активировал в модели знания из предметной области, позволив выбрать корректную терминологию вместо дословного перевода.
Проблема 3: Отсутствие культурной и тональной адаптации.
+ Пример (Туризм): «Позвольте себе незабываемый отдых!»
+ Yandex Translate: Hãy cho phép bạn một kỳ nghỉ khó quên! (Грамматически верно, но стилистически громоздко и нетипично для вьетнамской рекламы).
+ Оптимальный промпт: Tận hưởng kỳ nghỉ khó quên dành cho riêng bạn! (Более энергичный и личный призыв, «Tận hưởng» – наслаждайтесь, «dành cho riêng bạn» – специально для вас).
Компоненты «Тон» (энергичный, позитивный) и «Цель» (мотивировать к действию) направили модель на использование более динамичных глаголов и создание эмоционально окрашенного сообщения, соответствующего ожиданиям вьетнамской аудитории.
В целом, данная работа вносит вклад в развитие методологии машинного перевода с помощью LLM, показывая, что осознанный и лингвистически обоснованный подход к промпт-инжинирингу может значительно сократить разрыв между машинным и человеческим переводом.