Выпущена первая в Китае крупномасштабная речевая модель, поддерживающая 30 диалектов

Служба новостей Китая в Фучжоу сообщила 25 мая, что ИИ (искусственный интеллект) придаёт новую жизнь наследию языка и культуры. Китайские операторы выпустили первую масштабную речевую модель, поддерживающую смешанную речь на 30 диалектах.

25-го числа на 7-м Саммите по строительству цифрового Китая Научно-исследовательский институт искусственного интеллекта China Telecom представил первую в отрасли крупномасштабную модель распознавания речи, которая поддерживает свободное смешивание 30 диалектов - супермногодиалектную крупномасштабную модель распознавания речи Синчэнь. разрушая единую модель, он может распознавать дилемму конкретного диалекта и одновременно распознавать и понимать более 30 диалектов, таких как кантонский, шанхайский, сычуаньский и вэньчжоуский. Это крупнейшая модель распознавания речи в Китае, поддерживающая большинство диалектов. .

Китай имеет огромную территорию, и «в пределах ста миль существуют разные обычаи и разное произношение в радиусе десяти миль». Различные диалекты имеют разные грамматические и фонетические особенности. Традиционные исследования диалектов основаны на субъективном восприятии исследователями, что требует огромного количества рабочей силы и его трудно систематически маркировать. ИИ может более эффективно и систематически организовывать и обобщать диалекты, что имеет большое значение для защиты и наследования диалектов.

Создание высококачественной базы данных диалектов является основой для защиты и исследования диалектов. Научно-исследовательский институт искусственного интеллекта China Telecom создал более 30 высококачественных баз данных диалектов, насчитывающих более 300 000 часов. База данных диалектов находится на переднем крае отрасли с точки зрения богатства и высокого качества.

Кроме того, группа исследований и разработок China Telecom впервые применила алгоритм совместного обучения «перегонка + расширение» для решения проблемы коллапса перед обучением в сверхбольших наборах многосценарных данных и условиях крупномасштабных параметров.

Сообщается, что широко используется крупномасштабная модель голоса Синчэнь. Крупная модель голосовой связи Xingchen была опробована в интеллектуальной службе поддержки 10 000 клиентов China Telecom в Фуцзянь, Цзянси, Гуанси, Пекине, Внутренней Монголии и других местах. После подключения к большой модели Xingchen интеллектуальная служба поддержки клиентов может понимать 30 диалектов за секунды и обрабатывать в среднем около 2 миллионов вызовов в день. Кроме того, во многих городах на платформе 12345 была запущена большая модель Xingchen Voice.

Хуаншань, Аньхой: Гонка по озеру Тайпин

В Китае появятся 19 новых профессий

Подписывайтесь на наш Telegram канал : Наш Telegram канал