Бодякин В.И.

Институт проблем управления РАН им. В.А. Трапезникова, Москва

body@ipu.rssi.ru

ТЕХНИЧЕСКОЕ ЗАДАНИЕ НА ПОСТРОЕНИЕ ИСКУССТВЕННОГО РАЗУМА НА БАЗЕ НЕЙРОСЕМАНТИЧЕСКОГО ПОДХОДА

(SPECIFICATION OF THE ARTIFICIAL BRAIN

ON BASE OF THE NEUROSEMANTIC APPROACH)

Анализ теоретических наработок в области нейрокомпьютинга и искусственного интеллекта показывает их сегодняшнюю достаточность для формирования технического задания на построение искусственного разума (ИРМ). Появившиеся за последние полувека новые данные нейрофизиологии, лингвистики, психологии, computer science позволяют концептуально увидеть проект ИРМ, который по функциональным и количественным характеристикам будет превосходить биологический прототип. Стало понятно, что в основе становления ИРМ должно быть положено ограниченное число простых принципов, которые были бы способны его самосовершенствовать эволюционным путем. Наша группа предлагает рассмотреть проект построения ИРМ на основе нейросемантической парадигмы.

В качестве первого шага мы формализовали процесс взаимодействия информационных систем (ИС) с произвольной предметной областью (ПО). Под ПО рассматривается дискретное пространство с любыми взаимодействующими объектами. Взаимодействие объектов (при попадании их в одну ячейку пространства ПО) порождает энергоинформационный процесс, который может быть отображен в текстовой форме (дискретизированная амплитуда изменения некоторого параметра процесса отображается в алфавите А, а длительность процесса, <фразы> – числом символов этого алфавита) [1,2].

В любой физической ПО выполняются принцип причинности (детерминированности) и принцип подобия (гладкости) процессов взаимодействия. Каждый процесс однозначно отображается элементарной семантической единицей (ЭСЕ). Все множество взаимодействий для данной ПО представляет собой ее семантическое пространство из ЭСЕ. В качестве примеров ЭСЕ различных ПО можно рассмотреть: взаимодействие элементарных частиц – <ababcw>; <Привет Петров, как дела? Нормально!> – взаимодействие объектов макроуровневых ПО; образование двойной звезды из двух астрообъектов – <zzjbaabj> (на гигауровне) [1].

Текстовая форма – универсальная форма отображения (без потерь) всех форм представления информации (графической, акустической, текстовой и т.д.) [1,2].

Порождаемые ПО ЭСЕ, суперпозиционно "сливаются" в непрерывный информационный поток (ресурс ИР) и, соотвественно, задача информационной системы (ИС) заключается в: а) восприятии (отображении), б) хранении (память), в) преобразовании (логика ИС) и г) выдачи (эффекторы) ИР в ПО. При этом, для саморазвивающихся ИС дополнительными задачами являются: д) накопление энергоматериального ресурса из ПО и е) самокопирование [3].

Задача восприятия усложняется тем, что характеристики ПО априорно не определены и, соответственно, в ИР не заданы какие-либо маркеры разделяющие ЭСЕ. Если в процессе квантования ИР на информационные единицы (образы) в памяти ИС не будет ИР кратного вложения в них ЭСЕ, то потребность в ресурсе памяти ИС будет выражаться комбинаторными зависимостями от числа различных ЭСЕ в ПО и, в результате, практически будет невозможно построить ни одной ИС. Не решив эту задачу ранее, направление ИИ свелось к "игрушечным примерам".

Расширение понятия формального нейрона, вводом в него относительного времени активации входов, позволило получить нейроподобный N-элемент, который уже в единственном числе представляет простейшую ИС, способную "жить" в реальных (физических) ПО.

Объединив N-элементы в многодольный иерархический граф, удалось получить структуру аналогичную естественно-языковым. Первый слой (доля графа) N-элементов – терминальный, фактически отображает алфавит А ЭСЕ, второй слой – "псевдослоги" и строится на пространственно-временных ссылках на предыдущий (терминальный) слой, слой "псевдослов" –ссылается на "псевдослоги" и т.д., до N-элемента, отображающего в себе всю ПО.

В зависимости от качества кратности вхождения ЭСЕ в информационное содержание N-элементов (образы), для памяти ИС требуются различные объемы. Анализ информационного содержимого N-элементов иерархической структуры показал (на тестовых ПО), что при формировании ее алгоритмами минимизирующими ее физический ресурс (RИС = f(число N-элементов, число связей)) достигается тождественность (кратность) образов и ЭСЕ.

Таким образом, минимизируя физическую ресурсоемкость памяти ИС (RИС), мы автоматически получаем структуру N-элементов, которая гомоморфно отображает причинно-следственную структуру процессов (ЭСЕ) в ПО. Такую структуру мы назвали нейросемантической структурой (НСС), а процесс ее формирования – автоструктуризацией. НСС – это фактически готовая структура данных (процессов и объектов) произвольной ПО для любой ИС. Понятно, что ее автоматическое формирование открывает широкие горизонты для инженерии ИС. НСС попутно решает и вторую задачу ИС – б) эффективное хранение информации.

Одной из первых практических приложений НСС является крупномасштабная ассоциативная память, работающая в слабоструктурируемых информационных потоках. В качестве особенностей такой памяти можно отметить, что все ее технически значимые характеристики (коэффициент компрессии (RПО/RИС), надежность данных, время доступа) имеют тенденцию к улучшению по мере роста объемов вводимой информации.

В качестве другого значимого практического приложения НСС можно рассматривать высокоэффективный канал передачи данных ("Земля - Космос – Земля").

К теоретическим результатам НСС-технологии можно отнести формальную структуризацию ИР, как совокупности сигнала, информации и знания: "сигнал" - неструктурированная суперпозиция ЭСЕ; "информация" - сигнал, структурированный на иерархию ЭСЕ; "знание" – НСС (иерархия НСС) в ИС. При этом следует отметить, что величина компрессии ИР в структуру образов НСС (при постоянном потоке ИР и t® ¥ ) является индикатором потенциальной интеллектуальности ИС.

Основной параметр задачи в) преобразования ИР – повышение компактности (компрессии) преобразуемого в ИС отображения, естественно, что без потери информации.

На первом этапе эволюции ИС, ИР отображается только в фактографическую память ИС. Имея генетически или конструктивно заложенное прагматическое отношение к конкретным ЭСЕ (<ожог-Х> <боль-Ш>, <пища-С> <ресурс-Е> и т.д.), ИС инстинктивно реагирует (<ожог-Х> <движение-К> и т.д.) т.е., на каждое конкретное раздражение (Хi) – конкретная реакция (Уj).

Иерархическая НСС интегрирует и декомпозирует конкретные ЭСЕ в более крупные (по длине текстовой формы) или мелкие образы. При этом в НСС формируется как контекстные образы (иерархически более высокие причинно-следственные связи), так и ассоциативные образы (многократно входящие в вышележащие образы). Так ассоциативность, позволяет ИС выдвигать гипотезы о семантической связанности ЭСЕ, исходя из принципа информационного и прагматичного подобия их в ПО. Таким образом, перемещаясь по НСС можно виртуально ("мысленно") путешествовать по всей ПО, причем, за счет ассоциативности и контекстности можно существенно расширить изначально заданные генетически программы ("стимул-реакция").

На втором этапе эволюции ИС строится иерархическая структура из НСС. На фактографическую НСС, настраивается НСС2 ("ортогональная"), которая функционально воспринимает НСС, также как НСС воспринимает ПО. При этом у ИС появляется возможность реагировать не на конкретные образы (ЭСЕ) ПО, а на определенные состояния N-элементов в НСС, вызываемые этими образами (ЭСЕ2).

В качестве примера можно рассмотреть задачу - "формирование понятия абстрактного числа в ИС" (неразрешимую для классического ИИ, и легко решаемую биологическими ИС, как высшими животными, так и человеком). Одно из физических свойств N-элемента состоит в экспоненциальном падении величины возбуждения (U(t+1) = U(t) / k, например, при k=2) после его активации (U(t+1) = U(t) + 1*). На этом свойстве НСС построено функционирование ее кратковременной памяти (долговременная память НСС, – это связи между N-элементами).

Таким образом, если например, в слое "псевдослов" некоторый N-элемент, неоднократно активируется, то на нем будет 1*< U(t+1) < 2*. Если по другому информационному каналу (например, акустическому) будет активация N-элемента с информационным содержанием <два>, <три> или <семь>, то <два>, <три> или <семь> в НСС2 будет связано с данной величиной U(t+1). И следующий раз, когда будет такое же число распознаваемых объектов (совершенно новых, например, марсиан) – ИС выдаст реакцию, что их <два>, <три> или <семь>.

Данным примером мы продемонстрировали один из основных принципов построения ИС (искусственного разума) – сведение информационных (семантических) характеристик ПО к физическим параметрам ИС.

Научный аспект нейросемантического подхода также базируется на следующих основных принципах:

- ограниченный перебор;

- фрактальность образов;

- иерархическая организация ИС;

- минимизация отображения ИР в НСС (максимизация компрессии);

- перенос функциональной сложности задач ПО с элементной базы (процессоры) на самоорганизующиеся структуры (связи) ИС.

- фрактальность функций (использование единого механизма ассоциативной идентификации на всех уровнях функционирования ИС);

- и др.

Предварительные работы показали, что понятия, обозначающие характер мыслительной деятельности ИС: "понятно", "новое", "уже известно", "решение существует", "завершенное высказывание", "логическое высказывание" и многие другие, отображаются типовыми схемами НСС.

В частности, из приведенного списка рассмотрим два последних примера. Так "завершенность высказывания" – определяется величиной текстовой энтропии (ТЭ) [1]. При ТЭ > 0,3 высказывание можно считать (с большой вероятностью) законченным, при ТЭ < 0,01 – незавершенным. Величина ТЭ конкретного образа, в свою очередь, считается по отклонению его использования (число связей вверх) от нормализованного числа ссылок для данного слоя НСС.

Оказалось, что все завершенные "логические высказывания" обязательно содержат в своей текстовой форме повторения. Отсутствие повторений значимых образов в высказывании (при анализе всех в НСС контекстов!) является индикатором алогичности (<В огороде бузина, а Киеве дядька>), или чисто информационного высказывания (<Небо – голубое>). Так например, <большой объект (дом, …) закрывает маленький объект (дом, …)> – логическое высказывание, а <большая муха закрывает маленького слона> – уже нельзя считать не только логическим, но и завершенным.

Дальнейший анализ показал, что достаточно 2-3х примеров на произвольное логическое правило и в НСС2 формируется N-элемент, который при последующем получении незаконченного логического высказывания такого же типа, но уже с другими образами, завершает его корректно, с позиции ПО. В этом свойстве прослеживается генетическая связь ИРМ и естественных языков (ЕЯ). Как в биологии: … клетка ® ДНК (текст) ® клетка® …, так и в языке: … ЕЯ ® текст ® ЕЯ ® …, и вообще, эта дуальность характерна для всех самоорганизующихся систем. Таким образом, все типы логических высказываний произвольной физической ПО покрываются одним механизмом НСС (НСС2, НСС3, … НСС4).

Нашей группой, в течение последних пяти лет, не было обнаружено принципиальных теоретических и инженерных ограничений и запретов на возможность построения ИРМ на базе НСС (нейросемантического подхода). Разработаны прототипы компьютерного интерфейса (человек-ИРМ), разрабатываются системы предварительной обработки информации (графической, акустической и др.), а также механизмы сопряжения текстовой формы представления информации с различными рецепторными каналами и эффекторами (задача г) выдача реакции ИС). Для исследования и демонстрации эволюции информационных процессов от простейших ИС и до человека (социальные формы обучения) разработан адаптивный нейросемантический регулятор [4]. В МФТИ читается курс "Введение в нейросемантику" и готовятся к публикации методические материалы.

По нашим оценкам, вполне возможно через 12 месяцев получить программную реализацию ИРМ. Через 18 и 24 месяца сформировать на базе многопроцессорных ЭВМ (256-1024 RISC процессоров) и чисто аппаратную реализации ИРМ.

Перспективы появления в нашей жизни ИРМ грандиознейшие. Это на 2-3 порядка ускорение скорости решения любых "интеллектуальных" задач с одновременным повышением их сложности на 5-6 порядков. Для цивилизации это как реальный шанс ее светлого будущего, так и ее конца, особенно в сегодняшнее неуправляемое время "технологий глобального (воз)действия" (биотехнологий, информационных, ядерных). Без ИРМ человечеству в 21 веке практически не выжить и в подтверждение этого тезиса можно привести множество доводов [5].

Работы над созданием ИРМ должны проводиться только в рамках нового гуманистического мировоззрения и специализированной международной академической инфраструктуры. В качестве такой начальной модели по разработке ИРМ можно рассмотреть проект "Информоград" [6,7].

Список литературы

  1. Бодякин В.И., Куда идешь, человек? (Основы эволюциологии. Информационный подход). - М. СИНТЕГ, 1998, 332с.
  2. www.informograd.narod.ru/st/ir.htm
  3. Бодякин В.И. "Исследование структурных моделей открытых динамических систем", специальность: 05.13.01 (управление в технических системах), автореферат и диссертация на соискание ученой степени к.ф.-м.н., М. 1999 г.
  4. www.informograd.narod.ru/st/sr2.htm
  5. www.informograd.narod.ru/st/irm.htm
  6. "Восхождение разума" - www.informograd.narod.ru/pub_kn.htm
  7. Сайт www.informograd.narod.ru/
Hosted by uCoz