Разработчики представили крупнейшую ИИ-модель для распознавания тюркской и смешанной речи.
Фото: Pixabay
Казахстанский стартап Cybernet AI представил крупнейшую в Центральной Азии модель автоматического распознавания речи (ASR), созданную специально для тюркских языков. В отличие от западных аналогов эта разработка изначально обучалась на местной специфике, а не адаптировалась под нее, передает Liter.kz со ссылкой на прессс-службу Министерства искусственного интеллекта и цифрового развития РК.
В чем “фишка” новой моделиГлавная проблема глобальных гигантов вроде Google или OpenAI – они плохо понимают смешанную речь. Казахстанская модель корректно распознает диалоги, в которых спикеры переключаются с одного языка на другой прямо внутри предложения.
Поддерживаемые языки: казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский. Стойкость к “смешению”: ИИ уверенно понимает тюркско-русскую речь – тот самый формат, на котором говорит большинство жителей региона. Технологическая база: проект реализован при поддержке Astana Hub и Минцифры РК на мощностях облачной инфраструктуры Microsoft. Кому это нужноРазработку создавали для секторов, где цена ошибки в понимании клиента слишком велика:
Госуслуги: для автоматизации обращений граждан. Банки и финтех: для корректной работы голосовых помощников и верификации. Контакт-центры: модель устойчива к фоновым шумам и акцентам, что повышает точность расшифровки звонков до максимума.По словам разработчиков, этот проект – важный шаг к цифровой независимости Казахстана. Теперь отечественному бизнесу не нужно платить за зарубежные API, которые “спотыкаются” на казахской фонетике.
Читайте также: За отсутствие маркировки на ИИ-контенте будут штрафовать в Казахстане