Меню
Главная
Авторизация/Регистрация
 
Главная arrow Педагогика arrow Информационные технологии в науке и образовании

Модели сенсорных и языковых систем человека

В высшей нервной деятельности человека выделяют две системы функций, реализуемые нейронными семиотическими сетями: сенсорные системы и языковая система.

Человек обладает шестью сенсорными системами. Все они, кроме обонятельной, являются многоканальными. Например, зрительная система человека имеет два канала: ахроматический, обеспечивающий анализ формы, и цветовой.

Основные парадигмы моделирования сенсорных систем:

  • • общие принципы моделирования отдельных сенсорных каналов нейросетями;
  • • иерархическая организация искусственных нейронных сетей;
  • • выделение в искусственную нейронную сеть специальных групп нейронов;
  • • однородность способов восприятия сенсорными системами внешнего мира.

Системы речевого ввода и вывода информации

Существует две технологии речевого общения с компьютером: системы распознавания речи и системы синтеза речи.

Системы распознавания речи. В этих системах выполняется оцифровка звуковой информации, ее идентификация с кодами, содержащимися в электронных тезаурусных (иногда многоязычных) словарях, необходимая автоматическая коррекция кодов и генерация соответствующих им символов, слов и предложений, возможный вывод текстов на экран для ручной их коррекции (иногда звуковое воспроизведение) и запись текстов в память машины либо исполнение «услышанных» команд.

По характеру распознаваемой речи системы речевого ввода можно разделить на системы, ориентированные на распознавание отдельных слов, команд и вопросов, системы распознавания предложений и связной речи, системы идентификации по образцу речи.

Системы, ориентированные на распознавание отдельных слов, команд и вопросов. Данные системы часто называют системами речевого управления, поскольку их основная задача — обеспечить выполнение компьютерной системой действий, задаваемых голосом. Наибольшее распространение такие системы получили в автоматических телефонных службах. В них можно ввести голосом номер телефона вызываемого абонента или его имя, задать простой вопрос автоматической справочной службе.

Наиболее разработаны системы распознавания чисел, которые можно отнести к средствам распознавания первого поколения. В развитых системах такого рода человек сначала называет числовой пароль, затем свой числовой идентификатор и только после этого — число, кодирующее сущность запроса.

Системы распознавания предложений и связной речи. Системы этой группы делятся на системы раздельной диктовки и системы распознавания связной речи. Системы раздельной диктовки проще в разработке и технической реализации, но они требуют от пользователя не совсем естественного произнесения фраз — с короткой паузой перед каждым следующим словом. К таким системам относятся, например, ViaType корпорации IBM и Dragon Dictate фирмы Dragon System. Активный словарь системы насчитывает десятки тысяч слов и может пополняться пользователем по его профессиональной тематике

Системы идентификации по образцу речи. Данная идентификация по образцу речи относится к биометрическим технологиям идентификации человека по его уникальным физическим признакам, таким как отпечатки пальцев и рисунок радужной оболочки глаз. Речь, подобно подписи, характеризуется множеством постоянных физических параметров (которые, кстати, существенно меньше меняются со временем, чем внешность человека).

Цель систем идентификации по образцу речи — установить тождественность конкретного известного системе пользователя и выявить самозванца. Взаимодействие пользователя с системой идентификации состоит из трех этапов:

  • • регистрации пользователя с целью запоминания особенностей его голоса и формирования для него речевой модели;
  • • тестирования, во время которого выполняется сравнение поступившего образца речи с запомненной речевой моделью пользователя, а также возможное выявление модели самозванца из базы моделей голосов множества других людей;
  • • допуска к работе в системе, если тестирование прошло успешно и пользователь назвал верный пароль.

Системы синтеза речи. Системы речевого вывода информации базируются либо на выборке из словаря готовых оцифрованных звуковых последовательностей, либо на синтезаторах речи. Самым простым вариантом является выборка готовых звуковых последовательностей (как в автоответчике), но ввиду значительного размера звуковых файлов вывод большого числа слов в этом случае практически невозможен. В таких простых системах часто используются меню, по которым пользователь может выбрать те высказывания, которые он хотел бы услышать. При наличии нужных записей в базе данных их текст озвучивается. Подобные системы используются, например, в будильниках и в автомобильных навигационных системах.

Среди программ синтеза речи можно назвать шведскую систему Infovox, систему Monologue английской фирмы First Byte, систему Pro Verbe компании Elan Informatique и др.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 
Популярные страницы