Yandex.Cloud
  • Сервисы
  • Почему Yandex.Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Yandex SpeechKit
  • Начало работы
  • Релизы
  • Распознавание речи
    • О технологии
    • Распознавание коротких аудио
    • Распознавание длинных аудио
    • Потоковое распознавание
    • Форматы аудио
    • Модели распознавания
  • Синтез речи
    • О технологии
    • Описание метода API
    • Список голосов
    • Использование SSML
    • Список поддерживаемых фонем в SSML
  • Интеграция телефонии
  • Использование API
    • Аутентификация в API
    • Формат ответа
    • Диагностика ошибок
  • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
    • Действующие правила
    • Архив
      • Правила до 1 января 2019 года
  • Вопросы и ответы
  1. Релизы

Релизы YC SpeechKit

  • Текущая версия
    • Релиз 14.12.20
  • Предыдущие версии
    • Релиз 01.12.20
    • Релиз 24.11.20
    • Релиз 17.10.20
    • Релиз 26.10.20
    • Релиз 12.10.20
    • Релиз 18.08.20
    • Релиз 21.07.20
    • Релиз 27.05.20
    • Релиз 15.05.20
    • Релиз 16.04.20

Сервис SpeechKit предоставляет обновления в соответствии с системой моделей и версий.

Для распознавания

У версий модели generalсуществует несколько тегов:

  • general — этот тег указывает на основную версию.
  • general:rc — этим тегом обозначается релиз-кандидат, который вы можете тестировать.
  • general:deprecated — тег для предыдущей версии, которая доступна 2 недели с момента публикации новой основной версии.

Подробное описание доступных версий находится в разделе Модели распознавания.

Модель нового поколения hqa доступна только в транскрибации в версии Страдивари.

Для синтеза

В синтезе речи сервис предоставляет голоса двух типов: стандартные и премиум-голоса. В премиум-голосах используется новая технология синтеза.

Подробнее о голосовых моделях читайте в разделе О технологии.

Текущая версия

Релиз 14.12.20

В транскрибации по тегу модели hqa доступна новая версия Амати. В ней исправили случаи распознавания тишины вместо речи. Улучшили распознавание текстов из тематических доменов новостей и медицины.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Амати.

В стриминге, транскрибации и распознавании коротких аудио:

  • general— версия Зенон.
  • general:rc — версия Гален.
  • general:deprecated — версия Анаксимандр.

Предыдущие версии

Релиз 01.12.20

В стриминге, транскрибации и в распознавании коротких аудио по тегу general:rc доступна новая версия модели Гален. В ней улучшили базовое качество распознавания, а также распознавание слов, связанных с Covid-19.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Страдивари.

В стриминге, транскрибации и распознавании коротких аудио:

  • general — версия Зенон.
  • general:rc — версия Гален.
  • general:deprecated — версия Анаксимандр.

Релиз 24.11.20

После успешного тестирования версия Зенон стала основной рабочей версией модели general в стриминге, транскрибации и распознавании коротких аудио.

Доступность версий по тегам

Только в транскрибации:

  • hqa — версия Страдивари.

В стриминге, транскрибации и распознавании коротких аудио:

  • general и general:rc — версия Зенон.
  • general:deprecated — версия Анаксимандр.

Релиз 17.10.20

Внесли много исправлений в произношение отдельных слов за счет улучшенного механизма нормализации. Исправили склонение числительных. А по тегу alena доступна новая версия премиум-голоса alena.

Доступность версий по тегам

Без изменений.

Релиз 26.10.20

В транскрибации доступна модель распознавания нового поколения — hqa. У этой модели увеличенный словарный запас — результаты распознавания гораздо лучше, их легче воспринимать при чтении. Особенно этот эффект видно при распознавании длинных аудио.

Доступность версий по тегам

В транскрибации:

  • hqa — версия Страдивари.
  • general — версия Анаксимандр.
  • general:rc — версия Зенон.
  • general:deprecated — Марк Аврелий.

В стриминге и распознавании коротких аудио — без изменений.

Релиз 12.10.20

В новой версии существенно улучшили базовое качество распознавания. Новая версия модели general теперь доступна в стриминге, транскрибации, распознавании коротких аудио.

Доступность версий по тегам

  • general — версия Анаксимандр.
  • general:rc — версия Зенон.
  • general:deprecated — Марк Аврелий.

Релиз 18.08.20

Обновили версию Анаксимандр в транскрибации:

  • Улучшили работу с плотным потоком речи: когда в отрезках больше, чем 30 секунд, теперь нет заметных пауз.
  • Поправили работу тайминга.
  • Исправили ошибку с приходом частичных результатов распознавания уже после получения финального результата.

Акустические и языковые свойства модели остались прежними.

Доступность версий по тегам

Эти версии доступны для потокового распознавания, транскрибации и распознавания коротких аудио:

  • general — версия Анаксимандр.
  • general:rc — версия Анаксимандр (обновленная).
  • general:deprecated — версия Марк Аврелий.

Релиз 21.07.20

Теперь Анаксимандр — основная эксплуатируемая версия для потокового распознавания, транскрибации и распознавания коротких аудио.

Доступность версий по тегам

  • general и general:rc — версия Анаксимандр.
  • general:deprecated — версия Марк Аврелий.

Релиз 27.05.20

Новые версии модели general теперь доступны в транскрибации и в распознавании коротких аудио.

Доступность версий по тегам

Доступные версии по тегам:

  • general:rc — версия Анаксимандр.
  • general и general:deprecated — версия Марк Аврелий.

Доступные для потокового распознавания версии модели general:

  • general — версия Марк Аврелий.
  • general:rc — версия Анаксимандр.
  • general:deprecated — версия Диоген.

Релиз 15.05.20

Для потокового распознавания по тегу general:rc стала доступна новая версия модели Анаксимандр.

Доступность версий по тегам

  • general — версия Марк Аврелий.
  • general:rc — версия Анаксимандр.
  • general:deprecated — версия Диоген.

Версии для распознавания коротких и длинных аудио остались без изменений.

Релиз 16.04.20

Для потокового распознавания по тегу general стала доступна новая версия модели Марк Аврелий.

Доступность версий по тегам

  • general и general:rc — версия Марк Аврелий.
  • general:deprecated — версия Диоген.

Версии для распознавания коротких и длинных аудио, доступные по тегу general, остались без изменений.

В этой статье:
  • Текущая версия
  • Релиз 14.12.20
  • Предыдущие версии
  • Релиз 01.12.20
  • Релиз 24.11.20
  • Релиз 17.10.20
  • Релиз 26.10.20
  • Релиз 12.10.20
  • Релиз 18.08.20
  • Релиз 21.07.20
  • Релиз 27.05.20
  • Релиз 15.05.20
  • Релиз 16.04.20
Language
Вакансии
Политика конфиденциальности
Условия использования
© 2021 ООО «Яндекс.Облако»