Статья посвящена изучению новых тенденций переводческой деятельности в эпоху цифровизации, таких как использование нейронных сетей, машинного перевода и автоматизации перевода (CAT).
Ключевые слова: перевод, язык, цифровые технологии, машинный перевод, Интернет, нейронные сети.
Разработка переводческих технологий берет свое начало с середины ХХ века, однако их значительное развитие наблюдаются в течение последних двух-трех десятилетий. Современные лингвисты теперь осуществляют перевод посредством использования компьютера, нейронных сетей, сети Интернет, платформ автоматизации переводов (CAT-программы). С развитием цифровых технологий модель переводческой деятельности меняется в сторону автоматизации и появления новых видов обработки текста [1]. Так, например, возник новый вид профессии, называемый «постредактор машинного/нейросетевого перевода», где главной задачей лингвиста является редактирование переведенного машиной/нейросетью текста. Из этого следует, что современный лингвист при осуществлении перевода теперь должен знать не только язык и культурные особенности другой страны, но также уметь применять различные переводческие ресурсы и технологии. Москаленок В. отмечает, что функция переводчика в нынешней цифровой среде напоминает дирижёра, так как при переводе ему представляется возможность управлять различными процессами работы с текстом [2].
Для удобного управления всевозможными процессами перевода современный лингвист в первую очередь должен знать принцип работы CAT-программ. CAT-программа (Computer Assisted Translation) — это программное обеспечение, предназначенное для перевода, редактирования, хранения многоязычного контента [3]. Данный вид программного обеспечения помогает автоматизировать работу с огромным количеством текстов, тем самым сокращая и облегчая труд лингвистов. Одним из главных преимуществ CAT-программы является работа с общей базой данных. Это позволяет получать прямой доступ к памяти переводов, управлению терминологией и различным данным проекта.
Существует множество видов CAT-программ, но их принцип работы одинаков и состоит из трех этапов. На первом этапе лингвист загружает необходимый ресурс, из которого программа извлекает текст для перевода. На втором этапе программа разделяет текст на множество частей, которые называются сегментами. Один сегмент может состоять как из одного слова, так и из целого абзаца. Подобное разделение помогает лингвисту детально проработать текст. На третьем этапе лингвист осуществляет перевод каждого сегмента на требуемый язык в специально отведенном поле программы. Во время перевода программа накапливает огромную базу данных, которая называется памятью перевода. В дальнейшем, если в тексте встречается повторяющийся сегмент, программа автоматически подставляет перевод или предлагает вариант из памяти перевода. Благодаря этой функции CAT-программы лингвисту не требуется искать повторяющиеся части текста вручную или переводить заново, помогая частично автоматизировать работу. Однако главным недостатком памяти перевода является то, что она не способна распознавать различия повторяющегося текста, поэтому может автоматически подставлять перевод, не соответствующий новому контексту.
История возникновения машинного перевода начинается с 90-х годов, когда автоматические переводчики работали на основе встроенных грамматических правил и словарей (модель RMBT). Несмотря на значительное продвижение цифровизации в лингвистике, данный вид автоматического перевода стал неудачным, так как переведенный текст не соответствовал подобающему качеству и во многих частях терял свой смысл.
Следующим шагом в развитии машинного перевода стал статистический машинный перевод (модель SMT). Работа данного вида машинного перевода заключалась в сравнении больших объемов текстов по предложениям в паре языков в параллельных двуязычных корпусах текстов. Результаты перевода оказались не очень точными, но оказались более естественными, чем у модели RBMT. Объединение моделей RBMT и SMT оказалось главным шагом к развитию автоматических переводчиков, таких как PROMT DeepHybrid [4].
Переломным моментом для развития автоматического машинного перевода стала разработка нейронных сетей. Благодаря нейронным сетям значительно улучшилось качество автоматического перевода. Особенность нейросетевого машинного перевода заключается в том, что такой способ перевода не просто ищет и сопоставляет слова и выражения двуязычных корпусов, а детально анализирует каждый переводимый образец текста для выяснения контекста. Например, словосочетание «heavy rain» статистическим методом будет переводится как «тяжелый дождь», а нейросетевым — «ливень». Таким образом, нейронная сеть анализирует взаимосвязи каждых слов друг с другом, даже если они находятся в разных частях предложения. Данный способ помогает правильно определить контекст, обеспечивая естественность переведенного текста [5].
Несмотря на то, что благодаря нейронным сетям за минимальное количество времени можно добиться хорошего и качественного перевода текстов общего характера, они все еще не обладают достаточным переводческим опытом, который является важнейшим различием между человеческим и машинным переводом. Для сложных и творческих задач перевода, таких как разработка персонализированной документации, пользовательских интерфейсов, рекламных текстов и материалов для брендинга, опыт и возможность определения контекста профессионального лингвиста играют ключевую роль, а нейросетевой перевод не обеспечивает необходимой гибкости. Из-за недостатка эмоциональных и творческих способностей, а также ограниченного культурного понимания, искусственный интеллект не может обеспечить полноценный межкультурный перевод. Машинные переводы часто получаются стандартизированными и не несут необходимой коммуникативной и эмоциональной нагрузки. Следовательно, для корректной передачи межъязыковой информации и эффективной межкультурной коммуникации требуется обязательная доработка, интерпретация и адаптация машинного перевода квалифицированными специалистами.
Стремительное развитие цифровых технологий открыло новый этап в переводческой индустрии. Благодаря появлению цифровых технологий, лингвисты получили возможность быстро и эффективно обрабатывать большие объемы текстов, достигая при этом высокого качества перевода. Будущее переводческой сферы видится в плодотворном сотрудничестве человека и искусственного интеллекта. Человеческий интеллект со своей креативностью и способностью к адаптации в сочетании с эффективностью и скоростью машинного перевода, основанного на искусственного интеллекта, откроет новую эру в области межъязыковой коммуникации. Этот синергетический подход обещает не только повышение производительности, но и значительное улучшение качества перевода, обеспечивая тем самым беспрепятственное и эффективное взаимодействие между культурами.
Литература:
- Гао, Ц. Структура переводческой деятельности в эпоху цифровизации / Ц. Гао. — Текст: непосредственный // Litera. — 2022. — № 10. — С. 72–86.
- Москаленок, В. Цифровизация перевода и локализация программного обеспечения: быть дирижёром процессов / В. Москаленок. — Текст: электронный // Хабр: [сайт]. — URL: https://habr.com/ru/companies/bercut/articles/765884/ (дата обращения: 28.12.2024).
- Кому нужны CAT-инструменты и как с ними работать. — Текст: электронный // Хабр: [сайт]. — URL: https://habr.com/ru/articles/854074/ (дата обращения: 03.01.2025).
- Немиров, Д. М. Современные технологии в переводе / Д. М. Немиров. — Текст: непосредственный // Филологический аспект: международный научно-практический журнал. — 2023. — № 03. — Режим доступа: https://scipress.ru/fam/articles/nemirov-dm-sovremennye-tekhnologii-v-perevode.html (дата обращения: 04.01.2025).
- Мифтахова, Р. Г. Машинный перевод. Нейроперевод / Р. Г. Мифтахова, Е. А. Морозкина. — Текст: непосредственный // Вестник Башкирского университета. — 2019. — № 2. — С. 497–500.