Подпишитесь на нашу ежедневную рассылку с новыми материалами

Рынок и право


Губы | Изображение с сайта Sexum.ruКомпания «Центр Речевых Технологий» завершила работу над первой в истории технологией распознавания слитной русской речи на 30000 словоформ – «Руссограф». Инновационная разработка российской компании открывает новые возможности в общении человека с техникой на русском языке.
 
Оригинальная российская технология распознавания «Руссограф» создавалась с учетом фонетических и грамматических особенностей русского языка. Существующие на западе системы распознавания созданы для работы с английским, испанским и другими популярными языками и малоприменимы в работе с русской речью. Это связано с тем, что русский язык принципиально отличается от других языков не только фонетически (например звуком «ы»), но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи. В результате использование западных технологий для качественного распознавания русской речи не представляется возможным.

Для разработки технологии «Руссограф» ЦРТ создал научно-исследовательскую группу из специалистов в лингвистике, фонетике, математике, обработке сигналов и программировании. Для работы над проектом в ЦРТ использовали уникальный для России набор речевых баз данных, в который входят записи более чем 3000 дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Эти базы были использованы для создания акустических моделей звуков русской речи. Для создания языковых моделей в ЦРТ была собрана текстовая база русского языка объемом 35 миллионов слов. Поскольку создание качественной системы распознавания невозможно без обширных экспериментальных исследований, в ЦРТ был развернут мощный вычислительный кластер с производительностью около 1012 операций в секунду. Важной частью проекта стало создание базового речевого декодера, который преобразует речевой сигнал в текст.

Промышленное внедрение технологии распознавания «Руссограф» открывает новые возможности голосового управления компьютерной и бытовой техникой, промышленным оборудованием и транспортом; управления службами и сервисами по телефону; систематизации фонограмм и поиска по аудио архивам, а также обеспечения безопасности людей и объектов. Особенно актуальной новая разработка может стать для тех русскоговорящих людей, чьи физические возможности ограничены.

Сейчас ЦРТ работает над аппаратной реализацией технологии. Уже в 2008 году компания предложит несколько продуктов построенных на основе технологии распознавания, в частности систему интерактивного голосового управления для call-центров, а так же системы управления промышленными объектами. В перспективе компания планирует создание на базе технологий распознавания и синтеза карманного переводчика устной русской речи.

P.S. Интервью с директором компании "Речевые технологии", эксклюзивного представительства "Центра речевых технологий" в Минске, читайте тут.


Нужные услуги в нужный момент