Яндекс.Браузер применил искусственный интеллект для перевода веб-страниц

Яндекс.Браузер переводит веб-страницы при помощи искусственного интеллекта и гибридных методов перевода.

03 July, 19:51
Z-blog
Z-blog
Блог-мастер
3359
0

Мнение эксперта веб-студии Zexler о двух важных изменениях в системе языкового перевода в Яндекс.Браузер.

В блоге Яндекс.Браузер сотрудники сервиса раскрыли читателям, как в браузере реализовано решение проблематичной задачи языкового перевода контента. Два важных изменения вывели механизм перевода на новый качественный уровень. Хотя термин «механизм» звучит в данном контексте несколько архаично, но раскрывает суть и принцип перевода веб-страниц в Яндекс.Браузере. Для языкового перевода Яндекс использует автоматический машинный перевод, а эти два новведения изменили сам принцип и раздвинули границы возможностей этой технологии.

Перевод в Яндекс.Браузер

Гибридная модель перевода

Браузер теперь может переводить не только веб-страницу, а отдельные слова и фразы на странице. Это удобно для переводчиков, которые владеют иностраным языком. При помощи этой функции можно посмотреть перевод незнакомых слов.

Но не это главное. Эта новая функция позволила самой обучаемой системе более глубоко понимать смысл фраз. До этого изменения переводчик браузера обучался на базе переводов статей целиком. Это давало неестественный результат, в тексте перевода часто отстутствовала семантическая связь между словами и целыми фразами.

Такая проблема может быть решена при помощи нейросетей. Но и в этом решении есть изъян – русский язык настолько обширен и разнообразен, что не со всеми словами способны справиться современные искусственные нейронные сети, особенно с редкими.

В Яндексе решили проблему классически – переводчик браузера пользуется обоими моделями обновременно. При переводе задействуются и статистический переводчик, и нейросети. Но на этом процесс не заканчивается, далее при помощи специального алгоритма оценивается и выбирается лучший вариант перевода, который и выдается пользователю.  

Нейросетевая модель

При переводе веб-страниц важен не только текст самой публикации. У каждого иностранного языка есть свои особенности, которые могут быть отражены в заголовке материала, а также в навигационных элементах. Например, при переводе надписи на кнопке «Back» важно, чтобы система перевела как «Назад», а не такими вариантами, как «Спина» или «Отступать».

В таких случаях статистическая обучаемая система не решит проблему. Для ее решения специалисты сервиса Яндекс.Браузер воспользовались уже готовой технологической платформой – обученную на разноформатных текстах нейросеть из Яндекс.Переводчика. Система прошла дополнительный этап обучения на веб-страницах и теперь Яндекс.Браузер способен определять тип текстового контента и учитывать это при переводе.

Мнение эксперта

Татьяна Николаева, переводчик, менеджер проектов Zexler

«Живой язык – очень сложная система, которая плохо подчиняется правилам»  – наиболее удачная формулировка описания проблем любого машинного перевода. Чтобы довести переводческие навыки искусственного интеллекта хотя бы до 90%-ого идеала, потребуются десятки лет, а то и вечность. Безусловно, с каждым новым внедрением алгоритмов, функций, техник и прочих features результат становится только лучше, но капризные неувязочки все еще мешают достижению полноценного понимания.

Разработчики Яндекса на самом деле по-настоящему позаботились о своих пользователях, внедрив мгновенный перевод на страницы сайтов. Далеко не каждый юзер владеет иностранными языками, даже всемирно популярным английским. А значит, полезные по-заграничному оформленные сайты становятся недоступными огромному количеству пользователей. А возможно именно на них теплится ответ на интересующий вопрос или просто полезная/интересная/важная информация.

Важным решением разработчиков самого популярного браузера Рунета, на мой взгляд, стало внедрение именно комбинированного подхода. Гугл, к примеру, сосредоточен на применении только искусственного интеллекта, в то время как Яндекс старый способ не списывает со счетов, преимущество которого, как минимум, в хорошей способности запоминать редкие и сложные слова/фразы. Нейронная же сеть помогает собрать отдельные кусочки текста в подходящий контекст. Это говорит о том, что кропотливая работа специалистов вряд ли останется незамеченной и в действительности сможет помочь постепенно разрушить стену между интернациональными источниками информации. И пусть результаты статистики показывают улучшения в 1,7 – это уже можно считать большим шагом вперед.


N.B.

Не стоит забывать, что любой машинный перевод должен выступать исключительно в качестве помощника пользователям в общем понимании информации на сайте, а не как бесплатная замена человеческих переводческих услуг. До этого пока еще техника не дошла, а значит, кафедры перевода в ближайшие десятки лет еще могут выпускать специалистов на поиски работы по профессии.

Добавление комментария:

Подписаться на новые статьи

Подпишитесь на новые статьи и вы будете получать самые свежие новости прямо к вам на почту