> > > > Google Neural Machine Translation улучшит качество машинного перевода

Google Neural Machine Translation улучшит качество машинного перевода

Опубликовано:

google researchМногие пользуются машинным переводом Google чуть ли не каждый день, другие пользователи прибегают к его помощи лишь изредка, тем не менее, за последние несколько лет качество машинных переводов значительно улучшилось. Пару недель назад Google изменила алгоритм перевода и начала использовать Google Neural Machine Translation System (GNMT).

Десять лет назад Google представила первую технологию машинного перевода, основанную на возвратных нейронных сетях - Recurrent Neural Networks (RNN). Тогда система просто переводила каждое слово в точности так, как оно было написано в источнике. Качество результатов такого перевода варьировалось в огромных пределах в зависимости от сложности источника и конкретной языковой пары. Первые улучшения стали возможны после введения фазового машинного перевода - Phrase-Based Machine Translation (PBMT). Источник разделялся на отдельные слова и фразы, а контент уже подвергался некоторому анализу. С технологией PBMT машинный перевод стал значительно качественнее, но все равно он пригоден только для понимания базового смысла текста.

Google работала над Neural Machine Translation (NMT) в течение двух лет. Теперь текст-источник даже не разделяется, а воспринимается как единое целое. Поначалу алгоритм NMT был на уровне PBMT, но благодаря машинному и глубокому обучению, алгоритм может изменяться и обучаться самостоятельно. Вначале NMT работал очень медленно, и Google отказалась от его использования, но ситуация изменилась несколько недель назад.

Особенно сложно переводить с/на китайский язык, причем не важно, каким будет второй язык в языковой паре. Для перевода китайского языка метод PBMT не подходит. В данном случае лучше использовать NMT, поскольку данная технология способна анализировать перевод, который проходит в два этапа. Сначала энкодер переводит все слова подряд, затем декодер составляет уже законченную фразу, используя базу знаний и определяя вес каждого слова.

Methodik der Neural Machine Translation
Neural Machine Translation

NMT может обеспечить значительно лучшее качество перевода и сделать его гораздо более читаемым. PBMT может совершать от 55 до 85% ошибок при переводе китайского. При использовании NMT количество ошибок значительно сокращается. Конечно, качество еще далеко от перевода, выполненного профессиональным переводчиком, но благодаря NMT общий уровень качества машинных переводов значительно вырос.

В настоящее время Google использует NMT для всех переводов с английского на китайский. Ежедневно пользователи совершают около 18 миллионов подобных переводов. Постепенно новым методом будут переводиться и другие языковые пары. Поскольку количество возможных комбинаций составляет более 10.000 вариантов, компания сфокусируется на более важных языковых парах. Тем не менее, в конце концов NMT должен охватить все языки. В качестве оборудования для вычислений используется Tensor Processing Unit (TPU). Подобное железо уже применяется в сетях глубокого обучения, например, в компьютере Deep Mind, который обыграл человека в китайскую игру «Го». Следующим шагом Google планирует обучить Deep Mind играть в Starcraft II.