Mozilla запустила марийскую версию проекта Common Voice, распознающего человеческую речь

Переводом интерфейса Common Voice на марийский язык занимались сотрудники инновационного отдела развития культуры и языка Республиканского центра марийской культуры.

В создании сбора образцов языковых конструкций на марийском языке может участвовать каждый, даже те, кто представляет диалект той или иной местности. Для этого необходимо зайти на сайт https://commonvoice.mozilla.org/mhr проекта, прочитать представленные предложения, проверить правильность чтения и сохранить на сервере.

В настоящее время подключились к распознаванию текста более 130 пользователей. Это – сотрудники марийских СМИ и учреждений культуры, студенты и преподаватели вузов, представители общественных организаций. Сформирован банк из более 40 часов аудиозаписей.

«За год к программе для распознавания марийской речи могут подключиться около 1 тысячи человек, – отметил лингвист, организатор проекта Андрей Чемышев. – Чтобы ускорить процесс работы, объявили конкурс среди волонтеров».

Поставлена задача в течение 2022 года собрать голосовые образцы не менее 300 часов записи, что поможет достигнуть точности распознавания свыше 95%. Они нужны не только в системах распознавания языка, но и станут отличным материалом для совершенствования знаний по изучению марийского языка.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *