О чем эта история

Платформа PressReader предоставляет своим подписчикам цифровые версии популярных газет и журналов в приложениях для iOS, Android, на компьютерах и других устройствах.

С 2017 года платформа использует сервис машинного перевода Yandex Translate. При помощи облачных технологий PressReader переводит свыше 7 тысяч изданий, выходящих в 120+ странах и на более чем 60 языках.

Адаптация продукта к многоязычной среде

PressReader обрабатывает тысячи полос каждый день, извлекая из них тексты и изображения. The Washington Post, USA Today, The New York Times International Edition (International Herald Tribune), Daily Mail, The Herald — эти и многие другие газеты появляются на платформе, как только попадают в газетные киоски. Все материалы становятся доступны для поиска и легко читаются на мобильных устройствах.

PressReader делает публикации доступными для самого широкого круга читателей. Статью, вышедшую с утра на немецком, уже через пару часов может прочитать на своем родном языке и студент из Индии, и бизнесмен из США.

Переводить публикации вручную было бы невозможно: обеспечить такой объем и такую скорость работы не способно ни одно переводческое агентство. Для этого нужен качественный машинный перевод.

В условиях пандемии, когда у людей возросла потребность в онлайн-доступе к контенту, эта задача стала особенно актуальна.

Цена, качество, масштаб и скорость обработки данных

Чтобы создать собственный сервис машинного перевода, нужно нанять команду разработчиков, развернуть инфраструктуру и потратить много времени на разработку продукта. Затраты на проект автоматически делали бы его нерентабельным практически для любой компании.

Облачные технологии позволяют свести эти затраты к сравнительно небольшим операционным расходам. А еще они значительно облегчают хранение, систематизацию и передачу больших объемов информации.

На этапе выбора заказчик рассматривал три варианта: Yandex Translate, Microsoft Translator, Google Переводчик. Выбор был сделан в пользу сервиса машинного перевода компании «Яндекс», который по качеству и масштабируемости ничем не уступает конкурентам, но стоит при этом значительно дешевле.

Интеграция Yandex Translate

Yandex Translate подключен к PressReader с помощью API. Используя облачные технологии, сервис принимает от агрегатора тексты, с ходу определяя язык, на котором они написаны, и возвращает их обратно переведенными.

Интеграция сервиса машинного перевода в платформу PressReader заняла меньше недели. Теперь, чтобы ознакомиться с передовицей свежей La Repubblica или статьей в последнем номере Vogue France, не нужно знать итальянский или французский. Программа выполняет колоссальный объем работы и выдает итоговый результат практически мгновенно. Необходимая скорость обработки данных предоставляется облаком.

В Yandex Translate используется гибридная модель машинного перевода, включающая в себя нейросетевой и статистический подходы. Результат, полученный от обеих систем, оценивается алгоритмом, основанном на методе обучения CatBoost. При оценке учитываются десятки факторов — от длины предложения (короткие фразы и редкие слова лучше переводит статистическая модель) до синтаксиса. Алгоритм оценивает оба перевода по всем факторам, выбирает лучший и показывает этот перевод пользователю.

Пользователи получают мгновенный доступ к контенту на понятном для них языке

С помощью облачных технологий PressReader дает своим пользователям возможность прочитать любой выпуск практически любой популярной газеты или журнала в мире на любом из 60+ языков.

Агрегатор обеспечивает перевод для 365 языковых пар (и их число постоянно растет). Например, он может перевести текст с русского на французский и с финского на чешский. Ежемесячный объем материалов, переводимых PressReader с помощью Yandex Translate, превышает два миллиарда знаков.

Ведение бизнеса в международном масштабе всегда создает как дополнительные возможности, так и сложности, связанные в том числе с необходимостью адаптации продукта к многоязычной среде. Особенно это актуально для медийных платформ, пользователи которых привыкли получать мгновенный доступ к контенту на понятном для них языке и в удобном формате. При больших объемах информации обеспечить ее быстрый и качественный перевод могут только облачные сервисы. Наш четырехлетний опыт сотрудничества с PressReader показывает, что Yandex Cloud способна полностью обеспечивать растущие потребности международных компаний в уникальных сервисах и делать ценный контент доступным как можно более широкому кругу людей во всем мире.

Олег Коверзнев,
операционный директор Yandex Cloud

Мнение

Алексей Красноперов,
вице-президент по развитию PressReader
Алексей Красноперов,
вице-президент по развитию PressReader

На протяжении более чем четырех лет Yandex Cloud позволяет нам предлагать перевод высочайшего качества нашим читателям во всем мире. Сервис Yandex Translate было легко интегрировать в наш продукт, а его технологии постоянно совершенствуются. С начала использования Yandex Translate у нас не было ни одной жалобы на качество перевода: оно просто отличное.

Читайте в документации

Начало работы с Yandex Translate

Партнёры, которые могут помочь