Yandex Cloud
  • Сервисы
  • Решения
  • Почему Yandex Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Language / Region
Проект Яндекса
© 2023 ООО «Яндекс.Облако»
Yandex Translate
  • Начало работы
  • Пошаговые инструкции
    • Все инструкции
    • Перевод текста
    • Повышение точности перевода
    • Определение языка текста
    • Получение списка поддерживаемых языков
  • Концепции
    • Обзор
    • Дообучение моделей
    • Поддерживаемые языки
    • Глоссарии
    • Поддержка глоссариев
  • Справочник API
    • Аутентификация в API
    • gRPC
      • Обзор
      • TranslationService
    • REST
      • v2
        • Обработка ошибок
        • Диагностика ошибок
        • Обзор
        • Translation
          • Обзор
          • detectLanguage
          • listLanguages
          • translate
      • v1 (DEPRECATED)
        • Обзор
        • Перевод текста
        • Определение языка текста
        • Список поддерживаемых языков
        • Формат ответа
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
    • Действующие правила
    • Архив
      • Правила до 1 января 2019 года
  • Вопросы и ответы
  1. Концепции
  2. Дообучение моделей

Дообучение моделей

Статья создана
Yandex Cloud

    Функциональность находится на стадии Preview.

    Вы можете улучшить качество машинного перевода в определенной области знаний, используя собственные данные для тренировки модели. При этом качество переводов общей лексики не упадет.

    Какие данные требуются для дообучения

    Для дообучения требуются сегменты в виде оригинал-перевод в ТМХ-формате. Для получения значимого эффекта необходимы десятки тысяч таких сегментов.

    Важно

    Тексты должны максимально соответствовать целевому домену знаний (например, юридические документы, медицина, нефтегаз). Смешивание различных тематик приводит к худшим результатам.

    Как дообучить модель

    Заполните заявку на дообучение модели. В заявке укажите данные о вашем облаке и приложите TMX-файл. Модель будет обучена ориентировочно в течение 2 недель. Идентификатор модели придет на почту, указанную в заявке.

    Для использования модели укажите ее идентификатор в параметре model при отправке запроса.

    Кто будет иметь доступ к полученной модели

    Yandex Cloud не использует переданные данные для обучения собственных моделей. Полученная модель будет доступна только для каталога, указанного в заявке.

    Как тарифицируется дообучение модели

    На стадии Preview функциональность дообучения предоставляется бесплатно. Стоимость перевода полученными моделями соответствует текущим тарифам.

    Была ли статья полезна?

    Language / Region
    Проект Яндекса
    © 2023 ООО «Яндекс.Облако»