АДАПТИВНЫЙ РЕГУЛЯТОР НА НЕЙРОСЕМАНТИЧЕСКОЙ СЕТИ

Бодякин В.И., Чистяков А.А.

Институт проблем управления им. В.А.Трапезникова РАН

E-mail body@ipu.rssi.ru

Рассматривается эволюционный подход построения интеллектуальных систем на базе нейросемантических сетей. В общем случае, нейросетевой подход, это "размен" сложной алгоритмической процедуры задачи на распределенную структуру простых преобразований, решающих эту же задачу [1]. При наличии на сегодня высокопроизводительного и дешевого hardware и дорогостоящего и инерционного труда программистов (software), нейросетевой подход открывает перспективы по широкомасштабной автоматизации широкого класса процессов, охватывающего практически все аспекты нашего жизнеустройства.

Особенность рассматриваемой нейросемантической структуры (НСС) заключается во взаимнооднозначном соответствии семантических единиц (образов) предметной области и физических нейроподобных элементов (N-элементов) в которых отображаются эти образы.

НСС отображается многодольным графом в виде иерархической структуре словарей образов. При этом, чем меньше ИСС использует материального ресурса (МРИССсуммарное число N-элементов и связей между ними, в битах) для отображения постоянного потока образов (ИРИССинформационный ресурс), тем более эффективны (быстродействие, компрессия и др. характеристики) информационные системы на базе ИСС. В пределе,

ИРИСС / МРИСС ® 0, (1)

при t ® ¥

В работах [2,3] описаны алгоритмы автоструктуризации, которые из непрерывного информационного потока эффективно выделяют отрезки текста, соответствующие семантическим единицам исследуемой предметной области. Возможность построения НСС является необходимым условием для запуска самоорганизующихся процессов в информационных системах (ИС).

В качестве примера интеллектуальных систем, обучающихся управлению априорно неизвестными объектами (f(Xn)), рассматриваются нейросетевые регуляторы. Для их настройки необходимо только задать классы состояний или режимов, определяемые например как: "нормальные" (Xn+1 Î S) и "ненормальные" (Xn+1 Î Q) и, независимо от характера возмущений и начального состояния (X0 = Xn Î S), такая система управления, фактически при минимуме информации ("нормальное/ненормальное"), посредством воздействий (Fn) при дополнительных случайных возмущениях среды (Zn < Fn) находит алгоритм по поддержанию на управляемом объекте процессов в нормальных режимах (Xn+1 Î S, при любых n: n0 < n < ¥ , где n0 £ числа состояний объекта f(Xn) = | X | * | F |, обычно принималось | X | = | F | = N как по числу, так и по значениям).

Xn+1 = f( Xn) + Fn + Zn (2)

Обучение регулятора можно построить используя как "метод наказания" или "метод поощрения", так и их синтез. В работе аналитически анализировалось обучение только "методом наказания". Теоретически обосновано и экспериментально показано, что для любого объекта предложенная модель адаптивного нейросемантического регулятора устойчиво решает задачу по поддержанию объекта f(Xn) в "нормальной" области (Xn+1 Î S) при любых n: n0 < n < ¥ .

В качестве примера рассматривались объекты: упрощенный аналог обратного маятника – "шар на выпуклой полусфере" (объект №1), "шар на наклонной плоскости" (объект №2) и "шар на стохастической поверхности" и др. При этом, под Xn рассматривались текущие координаты шара, Fn - перемещение шара на расстояние в координатах Х. Областью "нормального" состояния объекта (Xn+1 Î S) полагалась нахождение шара на выбранной поверхности (f) и "ненормального" (Xn+1 Î Q), при скатывании с этой поверхности. Число состояний объекта принимало значения n0 = 49, 121, 225, 441. Результаты экспериментов с пояснениями приведены на графиках. По оси ординат – усредненная (по 100 попыткам) длительность удержания объекта в области "нормального" состояния (при n > N2 , т.е. больше мощности пространства состояний управляемого объекта, будем считать что регулятор успешно обучился). По оси абсцисс усредненный номер попытки обучения регулятора.

Введение в структуру регулятора блока нейроподобных элементов "начальное образование", которые дополнительно связывали конкретные подмножества Xn и Fn через заданные при получении "образования" отношения (например: Xn < Fn, Xn > Fn, Xn = Fn, Xn * Fn > 0, Xn * Fn < 0 и пр.) на гладких задачах ("выпуклая полусфера" и "наклонная плоскость") происходило существенное уменьшение n0 (n0 ~ | Xn |, при случайном X0 Î S). См. графики.

Теоретический анализ показывает, что при детерминированном начальном состоянии управляемого объекта X0 = Xi, для "гладких" f и при совпадении f с заранее данным регулятору "образованием", n0 = const ~ 3-5, независимо от общего числа состояний управляемого объекта.

Данный подход достаточно близок к практике интеллектуальных биологических информационных систем (homo-sapiens), когда изначально дают образование. Если оно оказывается применимым на практике, то данная предметная область более эффективно осваивается данной информационной системой. Если же знаний, данных в школе недостаточно, то решать задачу приходится перебором. С другой стороны, "избыточные" знания практически не ухудшают процесс решения. Эксперименты показали аналогичность результатов и для адаптивного нейросемантического регулятора.

Следующим шагом развития теории построения адаптивного нейросемантического регулятора на нейросемантической сети будет автоматическое формирование знания (отношений "состояний" – X и таких "воздействий" F, чтобы управляемые объекты находились в "нормальных" областях (Xn+1 Î S) ) об произвольной предметной области.

В докладе приводятся блок-схемы алгоритма нейросемантического регулятора №1 и его структура, а также регулятора №2 с априорным "начальным образованием". Анализируются экспериментальные данные процесса обучения нейросемантического регулятора №1 и №2. Также вводятся определения процессов: физического, информационного и формирование знания.

Практическое применение модели адаптивного регулятора №2 возможно для широкого класса задач, если они описываются гладкими функциями переходов состояния объекта. Это управление объектами в слабоизученных или сложных и агрессивных средах (планетоходы, роботы манипуляторы, адаптивные спутники и др.), а также обработка и кластеризация больших слабоструктурированных информационных потоков (работа с текстовой информацией, прогнозирование временных рядов и пр.).

Литература

  1. Уосермен Ф. Нейрокомпьютерная техника. М.: Мир. 1992. – 240 с.
  2. Бодякин В.И., Куда идешь, человек? (Основы эволюциологии. Информационный подход). - М. СИНТЕГ, 1998, 332с.
  3. Бодякин В.И., Чистяков А.А. Ассоциативные информационные структуры и модели памяти, - в сб. Проблемы информатики - материалы конференции "От истории природы к истории общества: "Прошлое в настоящем и будущем", М., 2003.

Hosted by uCoz