"Цифровизация осетинского языка": ИИ будет говорить на иронском и дигорском диалектах
"Цифровизация осетинского языка": ИИ будет говорить на иронском и дигорском диалектах
Глава Северной Осетии Сергей Меняйло сообщил о старте программы "Цифровизация осетинского языка", призванной сделать язык "видимым и слышимым" в цифровой среде.
Работа началась в 2023 году с создания языкового корпуса. Благодаря этому осетинский появился в Яндекс и Google Переводчик, но качество перевода остается низким, и ИИ требуется "доучить", рассказал советник главы РСО-Алания по вопросам цифровизации осетинского языка Александр Нартиков.
На данный момент корпус готов лишь на 10% — переведено около 100 тысяч фраз. Для полноценной работы необходимо от 1 до 1,5 миллиона фраз.
Параллельно ведется работа над синтезом речи (Text-to-Speech). Требуется записать большой объем речи для обучения ИИ. Жители республики участвуют в выборе голоса для ИИ через конкурс.
ИИ будет обучен обоим диалектам — иронскому и дигорскому. В федеральные сервисы интегрируют литературный язык, а внутри республики платформа будет поддерживать все диалекты.
На основе программы планируется создать образовательные платформы, умные колонки и другие сервисы. Все результаты проекта будут открыты для общественности #social
Спутник Южная Осетия в MAX




















