Статья:

РАЗРАБОТКА ОПТИМАЛЬНЫХ ПРОМПТОВ ДЛЯ МАШИННОГО ПЕРЕВОДА С РУССКОГО НА ВЬЕТНАМСКИЙ В СФЕРЕ МАРКЕТИНГА

Конференция: CCCVIII Студенческая международная научно-практическая конференция «Молодежный научный форум»

Секция: Филология

Выходные данные
Хюинь Л.Т. РАЗРАБОТКА ОПТИМАЛЬНЫХ ПРОМПТОВ ДЛЯ МАШИННОГО ПЕРЕВОДА С РУССКОГО НА ВЬЕТНАМСКИЙ В СФЕРЕ МАРКЕТИНГА // Молодежный научный форум: электр. сб. ст. по мат. CCCVIII междунар. студ. науч.-практ. конф. № 29(308). URL: https://nauchforum.ru/archive/MNF_interdisciplinarity/29(308).pdf (дата обращения: 19.08.2025)
Идет голосование
Эта статья набрала 0 голосов
Мне нравится
Дипломы
лауреатов
Сертификаты
участников
Дипломы
лауреатов
Сертификаты
участников
на печатьскачать .pdfподелиться

РАЗРАБОТКА ОПТИМАЛЬНЫХ ПРОМПТОВ ДЛЯ МАШИННОГО ПЕРЕВОДА С РУССКОГО НА ВЬЕТНАМСКИЙ В СФЕРЕ МАРКЕТИНГА

Хюинь Льен Тхи Тху
студент, Хошиминский государственный педагогический университет, Вьетнам, г. Хошимин
Хоанг Чанг Тхи Хонг
научный руководитель, канд. филол. наук, Хошиминский государственный педагогический университет, Вьетнам, г. Хошимин

 

Появление больших языковых моделей (LLM) открыло новую эру в машинном переводе (МП). Качество перевода с помощью LLM зависит не только от архитектуры модели, но и от точности формулировки входной инструкции – промпта. Как отмечают В.М. Ломшаков и С.И. Николенко, промптинг позволяет «управлять поведением модели для порождения нужных ответов» без необходимости ее переобучения [1, с. 322].

Исследования промпт-инжиниринга сосредоточены на высокоресурсных языковых парах (например, англо-немецкая, англо-китайская), что оставляет пробел в изучении промптов для типологически далеких языков, таких как русский (флективный) и вьетнамский (изолирующий). Стандартные промпты часто игнорируют грамматические и прагматические различия, приводя к буквализмам. Для анализа создан корпус из 200 русскоязычных предложений из рекламных кампаний 2022–2024 гг., разделенный на три домена: телекоммуникации (70 предложений), туризм (70 предложений) и банковские услуги (60 предложений).

Перевод предложений из корпуса выполнялся с использованием четырёх подходов: Google Translate, Yandex Translate, DeepSeek-V2 (базовый промпт) и DeepSeek-V2 (оптимальный промпт). При этом для DeepSeek применялись два варианта промпта: базовый («Переведите на вьетнамский язык: [оригинальный текст]») и оптимизированный промпт, разработанный в рамках настоящего исследования. На основе пилотного исследования и анализа литературы была финализирована следующая пятикомпонентная структура промпта:

<Роль> Вы – профессиональный переводчик и маркетолог, специализирующийся на адаптации российских рекламных кампаний для вьетнамского рынка. <Задача> Перевести следующий рекламный текст с русского на вьетнамский язык. Ваша задача – не дословный перевод, а создание прагматически эквивалентного текста, который будет звучать естественно и убедительно для вьетнамской аудитории. Учтите культурные особенности и маркетинговые конвенции Вьетнама. <Цель перевода> Главная цель – привлечь клиента и мотивировать его к действию. Текст должен быть ясным, привлекательным и вызывать доверие. <Тон> Дружелюбный, но профессиональный; энергичный и позитивный. <Оригинальный текст> «[вставить текст]»

Применялся гибридный подход к оценке:

- Автоматические метрики: BLEU для оценки лексического совпадения с эталоном; COMET (COMET-22) для оценки семантической близости, учитывающей контекст.

- Экспертная оценка: оценивали каждый перевод по шкале штрафных баллов (от 0 до 3) на основе 6 критериев, адаптированных из работ О.В. Максютиной [2] и О.А. Щетининой [3]: 1) Полнота передачи содержания: наличие необоснованных опущений; 2) Степень искажения смысла: грубые смысловые ошибки; 3) Точность терминологии: адекватность перевода маркетинговых и отраслевых терминов; 4) Ясность и естественность выражения: соответствие нормам вьетнамского языка; 5) Смысловая связность (прагматика): соответствие цели и контексту рекламного сообщения; 6) Ориентированность на получателя: культурная адаптация, учёт ожиданий целевой аудитории.

Общий показатель качества (ОПК) рассчитывался как средний процент отсутствия ошибок по всему корпусу. Результаты оценки по всему корпусу сведены в Таблицу 1.

Таблица 1.

Сводные результаты оценки качества перевода

Метод перевода

BLEU

COMET

ОПК

Google Translate

28,5

0,76

61,4%

Yandex Translate

29,1

0,78

64,2%

DeepSeek (базовый промпт)

30,5

0,81

68,5%

DeepSeek (оптимальный промпт)

39,2

0,91

94,7%

 

Данные однозначно показывают, что оптимальный промпт обеспечивает существенное улучшение качества перевода по всем метрикам. Разрыв особенно велик в экспертной оценке (ОПК), что подчеркивает способность структурированного промпта решать проблемы, выходящие за рамки лексикосемантического совпадения.

Анализ типичных ошибок и их решение с помощью оптимального промпта

- Проблема 1: Буквальный перевод синтаксических конструкций.

+ Пример (Банки): «Откройте вклад и получите уверенность в завтрашнем дне».

+ Базовый промпт: Mở một khoản tiền gửi và nhận được sự tự tin vào ngày mai. (Буквализм, «уверенность в завтрашнем дне» звучит неестественно).

+ Оптимальный промпт: Gửi tiết kiệm ngay hôm nay để vững tâm cho tương lai. (Идиоматичный перевод: «уверенность» заменена на «vững tâm» – спокойствие духа, «завтрашний день» на «tương lai» – будущее, что является прагматическим эквивалентом в финансовом контексте).

Компонент промпта «Задача», требующий «прагматически эквивалентного текста», побудил модель отойти от синтаксического копирования и найти функциональный аналог во вьетнамском языке.

Проблема 2: Неадекватный перевод маркетинговой лексики.

+ Пример (Телеком): «Наши предложения охватывают направления вызовов со льготами в 20 стран мира».

+ Google Translate: Ưu đãi của chúng tôi bao gồm các điểm đến cuộc gọi... («điểm đến cuộc gọi» – букв. «пункты назначения звонков», туристический оттенок).

+ Оптимальный промпт: Chúng tôi cung cấp gói cước quốc tế ưu đãi đến 20 quốc gia. (Использован точный отраслевой термин «gói cước quốc tế» – международный тарифный план).

Компонент «Роль» («переводчик и маркетолог») активировал в модели знания из предметной области, позволив выбрать корректную терминологию вместо дословного перевода.

Проблема 3: Отсутствие культурной и тональной адаптации.

+ Пример (Туризм): «Позвольте себе незабываемый отдых!»

+ Yandex Translate: Hãy cho phép bạn một kỳ nghỉ khó quên! (Грамматически верно, но стилистически громоздко и нетипично для вьетнамской рекламы).

+ Оптимальный промпт: Tận hưởng kỳ nghỉ khó quên dành cho riêng bạn! (Более энергичный и личный призыв, «Tận hưởng» – наслаждайтесь, «dành cho riêng bạn» – специально для вас).

Компоненты «Тон» (энергичный, позитивный) и «Цель» (мотивировать к действию) направили модель на использование более динамичных глаголов и создание эмоционально окрашенного сообщения, соответствующего ожиданиям вьетнамской аудитории.

В целом, данная работа вносит вклад в развитие методологии машинного перевода с помощью LLM, показывая, что осознанный и лингвистически обоснованный подход к промпт-инжинирингу может значительно сократить разрыв между машинным и человеческим переводом.

 

Список литературы:
1. Ломшаков В.М., Николенко С.И. Применения больших языковых моделей для задач порождения и обработки программного кода // Записки научных семинаров ПОМИ. 2024. Т. 540. – С. 276–350.
2. Максютина О.В. Переводческая ошибка в методике обучения переводу // Вестник Томского государственного педагогического университета. 2010. № 1. – С. 49–52.
3. Щетинина Н.А. Формирование переводчика как профессиональной языковой личности в современных условиях обучения // Вестник РМАТ. 2019. –С. 91–94.