«Яндекс» добавил в свои сервисы технологию синтеза и распознавания чувашской речи. Она появилась в «Переводчике», «Поиске» и «Клавиатуре».
Чувашский язык стал вторым языком народов страны, для которых стала доступна такая возможность. Этот проект стал результатом сотрудничества ЧГИГН с «Яндексом», Федеральным агентством по делам национальностей и Домом народов России.
Ключевую роль в распознавании чувашской речи сыграл Чувашский государственный институт гуманитарных наук.
ЧГИГН помог собрать базу данных из ста тысяч озвученных чувашских предложений и фраз для системы распознавания чувашской речи. В этом процессе участвовали не только сотрудники института, но и привлеченные педагоги, учителя, студенты. Весь сбор информации проходил на платформе «Яндекс.Задания».
Команда, занимавшаяся сбором речевых образцов, состояла из 30 человек. Работа проходила с большим энтузиазмом, многие с нетерпением ждали появления новых заданий на платформе. Затем собранные данные были обработаны специалистами «Яндекса», после чего на их основе прошла обучение нейросеть. Для корректного функционирования синтезатора чувашской речи специалисты ЧГИГН проводили консультации и предоставляли необходимые данные.
В ходе работы над проектом проводилась онлайн-встреча с командой «Яндекса», в рамках которой были выработаны рекомендации по улучшению качества синтезатора речи.
В мобильном приложении «Переводчика» также появился режим диалога на чувашском, который позволяет общаться с носителями языка, не зная его. Например, один пользователь спрашивает на чувашском, второй отвечает на русском, а сервис переводит и озвучивает сказанное на соответствующих языках.
Источник: Чувашский государственный институт гуманитарных наук