GritTec анонсировал новую версию технологии автоматической текстонезависимой голосовой идентификации
8 Мая 2009
Технология автоматической голосовой идентификации предназначена для идентификации неизвестной аудиозаписи в отложенном режиме путем парного сравнения с образцами аудиозаписей известных дикторов.
В новой версии изменения коснулись модуля вычисления вероятностей наблюдений и модулей построения и оценки ошибок 1-го (FRR) и 2-го (FAR) рода. В частности, в алгоритмической части была изменена оценка вероятностей наблюдений на основе максимизации вероятности наблюдений по S-состояниям. В модуле построения ошибок (FRR, FAR) изменена технология построения FAR, и ее оценка в режиме идентификации.
Были изменены структуры, используемые при описании образца аудиозаписи диктора:
- структура модели голоса (voice model);
- структура модели ошибок (FAR, FRR, ERR);
- структура модели диктора, состоящая из структур модели голоса, модели ошибок и модели окружающих шумов и канальных искажений.
Так, в структуре модели голоса было оптимизировано статистическое описание смешанных Гауссовых моделей (GMM) с учетом S-состояний и вероятностей перехода между ними.
Технологию голосовой идентификации GritTec будет продвигать на рынок биометрии под маркой GritTec’s Speaker-ID (см. urls: www.speaker-id.com, www.speaker-id.ru) в виде коммерческой версии системы голосовой идентификации для небольшого объема баз данных (не более 5 – 10 тысяч образцов аудиозаписей известных дикторов) и для разработчиков в виде пакета библиотек SDK.
В настоящее время прототип GritTec’s Speaker-ID прошел предварительные испытания в офисных условиях и на специализированных звуковых базах записей телефонных фонограмм. Для разработчиков пакет библиотек SDK новой версии GritTec’s Speaker-ID и ее демонстрационная версия будут доступны в ближайшем будущем.
О компании GritTec
ГритТек лаборатория (OOO "ГритТек") специализируется на исследованиях и разработках алгоритмов в области речевых, аудио технологий и методах цифровой обработки сигнала (DSP). Основные исследования ГритТек лаборатории сфокусированы в области: технологий шумоподавления и восстановления речевых сигналов, технологий биометрии голоса, анализа и синтеза речевых сигналов.
url: http://www.grittec.ru
В новой версии изменения коснулись модуля вычисления вероятностей наблюдений и модулей построения и оценки ошибок 1-го (FRR) и 2-го (FAR) рода. В частности, в алгоритмической части была изменена оценка вероятностей наблюдений на основе максимизации вероятности наблюдений по S-состояниям. В модуле построения ошибок (FRR, FAR) изменена технология построения FAR, и ее оценка в режиме идентификации.
Были изменены структуры, используемые при описании образца аудиозаписи диктора:
- структура модели голоса (voice model);
- структура модели ошибок (FAR, FRR, ERR);
- структура модели диктора, состоящая из структур модели голоса, модели ошибок и модели окружающих шумов и канальных искажений.
Так, в структуре модели голоса было оптимизировано статистическое описание смешанных Гауссовых моделей (GMM) с учетом S-состояний и вероятностей перехода между ними.
Технологию голосовой идентификации GritTec будет продвигать на рынок биометрии под маркой GritTec’s Speaker-ID (см. urls: www.speaker-id.com, www.speaker-id.ru) в виде коммерческой версии системы голосовой идентификации для небольшого объема баз данных (не более 5 – 10 тысяч образцов аудиозаписей известных дикторов) и для разработчиков в виде пакета библиотек SDK.
В настоящее время прототип GritTec’s Speaker-ID прошел предварительные испытания в офисных условиях и на специализированных звуковых базах записей телефонных фонограмм. Для разработчиков пакет библиотек SDK новой версии GritTec’s Speaker-ID и ее демонстрационная версия будут доступны в ближайшем будущем.
О компании GritTec
ГритТек лаборатория (OOO "ГритТек") специализируется на исследованиях и разработках алгоритмов в области речевых, аудио технологий и методах цифровой обработки сигнала (DSP). Основные исследования ГритТек лаборатории сфокусированы в области: технологий шумоподавления и восстановления речевых сигналов, технологий биометрии голоса, анализа и синтеза речевых сигналов.
url: http://www.grittec.ru
Последние новости раздела
16 апреля 2024
16 апреля 2024