ФОРМАЛИЗАЦИЯ ОПРЕДЕЛЕНИЙ ПРОЕКТА "ИСКУССТВЕННЫЙ РАЗУМ"
Бодякин В.И.
Институт проблем управления РАН им. В.А. Трапезникова, Москва
body@ipu.ru , http://www.informograd.narod.ru , служ.тел.:334-92-39(На правах рукописи) 07.07.10
Введение. Характерной чертой последних десятилетий нашего времени является чрезвычайное ускорение всех процессов в обществе: от научно-технических и социально-экономических, вплоть до биологической эволюции. Не обошло это ускорение и проблему построения искусственного интеллекта. Обычно пробегая, коллега интересуется "нет ли чего нового, что можно было бы быстренько внедрить" и в результате этой "быстроты", тянутся более чем полувековые не материализовавшиеся прогнозы по ИИ, при уверенности большинства специалистов, что при фундаментальном и междисциплинарном подходе проблема решаема в приемлемые сроки.
Проведенный нашей группой анализ теоретических наработок в области нейрокомпьютинга и искусственного интеллекта показывает их сегодняшнюю достаточность для формирования технического задания на построение искусственного разума (ИР). (ИР – это ИИ в расширенном понимании [1], т.е., способный к самоорганизации при решении любых априорно неизвестных задач). Появившиеся за последние полувека новые данные нейрофизиологии, лингвистики, психологии, computer science и других смежных дисциплин позволяют концептуально увидеть проект ИР, который по функциональным и количественным характеристикам будет превосходить биологический прототип. Стало понятно, что в основу становления ИР должно быть положено ограниченное число простых принципов, которые были бы способны его самосовершенствовать эволюционным путем. Наша группа предлагает тезисно рассмотреть принципы проекта построения ИР на основе нейросемантической парадигмы [2].
Проект находится в стадии разработки и подробное и формальное ознакомление с ним и его разделами (механизм эволюции, природа информации, текстовая энтропия, информационная система и пр.) возможно в Институте проблем управления РАН [body@ipu.ru]. Программное ядро проекта - нейросемантическая форма представления информации, уже реализовано в виде (форме) крупномасштабной ассоциативной памяти. Цель данного обсуждения, это уточнение и выявление возможных некорректностей предлагаемого проекта к современной научной парадигме, а также возможной неполноты его изложения в рамках поставленной задачи, как инженерного проекта ИР. Данный материал состоит из трех частей:
1. Модель механизмов и направленности эволюции,
2. Комплексное рассмотрение взаимодействий предметной области и информационной системы, 3. Структура информационного ресурса (сигнал – информация – знание).
Они самодостаточны и их можно рассматривать по отдельности. Для вдумчивого читателя рекомендуется последовательно, шаг за шагом, просмотреть весь материал, сопоставляя его со своими взглядами, чтобы постоянно чувствовать "твердую почву под ногами". Для спешащего, можно опускать целые разделы, в частности, следующий - "о механизмах эволюции", читая лишь выводы и ожидая чуда в виде ИИ, или же продолжая повторять, что "этого не может быть никогда", а если уж и появится ИИ, то уж "точно никак ни в России".
1. Зарождение и механизмы направленности эволюции простейших информационных систем. В качестве модели окружающей среды (предметной области – ПО) зарождения информационных систем (ИС) предположим, что первоначальный "Большой символьный взрыв" порождает множество символов "а" алфавита А {a,b,c,d,…,w,x,y - аналоги химических элементов и z - как аналог пространства}. Далее, символы в соответствии со своим "полупериодом синтеза" начинают эволюционировать в тексты (a→bb→bccz; bb→ccccz; ccb→ddcbz; …). В результате порождается "текстовой бульон". Известно, что простейшие компьютерные вирусы, как простейшие информационные системы, состоят из нескольких сотен байт. Следовательно, таким случайным образом могут сформироваться простейшие самодублирующиеся ИС, которые за счет дальнейших мутаций могут эволюционировать в "символьной среде" ("текстовая жизнь"), см. рис. 1. При этом тексты среды рассматриваются одновременно: как строительный материал, как носитель энергетического потенциала (a>b>c>d>…>w>x>y>z=0) и как источник упреждающей информации.
Рис. 1.
Первый эволюционный аттрактор ИС – "рецепторный". Он выражается в тенденции к расширению диапазона рецепторного окна ИС, т.к. при линейном увеличении размеров окна (L - длины воспринимаемых текстов через "Ввод", см. рис. 1) разнообразие и количество воспринимаемых ("меню") текстов увеличивается в степенной функции, как AL, где А – алфавит текстов (см. рис. 2).
Рис. 2.
Если бы, например, в ИС эволюционировали другие блоки, то результат был не более чем линеен. Поэтому на первых эволюционных ступенях первоочередность развития в ИС "рецепторного" блока очевидна. Это наглядный пример безальтернативности эволюции ИС через этапы аттракторов.
Первый эволюционный аттрактор ИС, это пример положительной обратной связи, приводящий к экспоненциальному взрыву численности ИС, с естественной вынужденной последующей длительной стабилизацией при (заполнении) использовании всего энерго-вещественного ресурса ниши, это уже пример отрицательной обратной связи. Т.е. положительная обратная связь, - скачок эволюционного развития и отрицательная обратная связь, - эволюционный консерватизм [3].
Дальнейший ход эволюции ИС будет находиться в русле шести аттракторов, как относительных нелинейностях в энерго-вещественных характеристиках ПО и его градиент будет ориентирован в направлении повышения крутизны этих нелинейностей. Количественно этот процесс будет выражаться в росте эволюционного потенциала ИС [7].
Кратко резюмируя материал этого раздела, отметим что в нем:
- показана возможность начального описания модели ПО ("текстовой бульон");
- показана практическая возможность самозарождения простейшей ИС;
- приведена структура простейшей ИС;
- показан первый аттрактор (как нелинейность ПО) и механизм направленности эволюции простейшей ИС (расширение рецепторного окна);
- введено понятие эволюционного потенциала (подробно см. далее).
2. Комплекс: "Предметная область - Информационный канал - Информационная система". Корректное формальное рассмотрение проекта "Искусственный разум" возможно только в рамках комплекса: "Предметная область - Информационный канал - Информационная система" и формализации его компонент, см. рис. 3.
Рис. 3.
Предметная область (ПО) - это дискретная пространственно-временная совокупность с взаимодействующими в ней физическими объектами.
Основной физический процесс есть результат взаимодействия физических объектов предметной области (ПО) в соответствии с ее внутренними законами (f(ПО)).
Основной физический процесс порождает множество разнообразных сопутствующих физических процессов.
Совокупная энергетика основного физического процесса равна суммарной энергетике всех последующих сопутствующих ему разнообразных физических процессов.
Энергетика физического процесса - это некоторый инвариант, характеризующий потенциальную глубину причинно-следственного распространения данного физического процесса в ПО, до его полного растворения (исчезновения, неразличения) среди других физических процессов.
Предположим, что скорости распространения разнообразных физических процессов в пространстве ПО различны.
Мы будем рассматривать только такие ПО, в которых существуют малоэнергетические сопутствующие процессы с большими скоростями распространения в ПО от места их возникновения по сравнению с более энергоемкими процессами, сопутствующими основному физическому процессу.
Для краткости, малоэнергетические сопутствующие процессы мы будем называть сигнальными или информационными. Вся наша дальнейшая работа будет нацелена только на работу с данным классом физических процессов.
Все физические процессы, распространяясь в пространстве от породивших их источников, будут взаимодействовать между собой, порождая в некоторой области обобщенный физический процесс. Который, в свою очередь, представляет суперпозицию и интерференцию энергетики всех физических процессов достигших данной точки пространства, в данный момент времени.
Место пространства, где происходит (окончательное) формирование обобщенного физического процесса, назовем информационным каналом (см. рис. 1).
Далее, обобщенный физический процесс достигает "S-рецепторов-детекторов" информационной системы (ИС), которые функционируют в дискретном режиме (см. рис. 1).
Любой физический процесс - это интегральная характеристика, выражающаяся в изменении величины одного или нескольких параметров (W) в течение интервала времени (t2 − t1), и его можно представить в (дискретной) текстовой форме (ТФ), см. рис. 4.
Рис. 4.
Лемма 1. Любой многомерный физический процесс взаимнооднозначно переводим в текстовую форму и обратно с любой необходимой (заданной) степенью точности ∆W и ∆t.
Данная лемма является первым основополагающим утверждением Проекта. Далее, говоря о процессе, событии, или совокупности событий в ПО, и представлении и анализе их в информационной системе (ИС, см. далее), нам будет достаточно рассмотрения только их текстовой формы (ТФ).
ТФ – это универсальная форма отображения (представления, описания) всех процессов, включая процессы и в самой ИС.
Соответственно, все физические процессы ПО (далее просто процессы) во всей их совокупности, можно отобразить в виде текстового потока.
Так как процессы в ПО происходят в соответствии с ее внутренними законами (f(ПО)), то они истинны, и текстовой поток отражает эту объективность (W).
Так как S-рецепторы ИС могут воспринимать только не более, чем проекцию текстовой потока (S), то воспринимаемый в ИС текстовой поток является не более, чем проекцией истины ПО.
Будем полагать, что в комплексе: "ПО-ИК-ИС" выполняются:
- принцип причинности (инвариантность процессов во времени и в пространстве);
- принцип глобальной дискретизации (сворачиваемость в ИС всего диапазона шкалы по любому параметру W к нескольким качественным характеристикам - образам);
- принцип субъектности, т.е. каждый процесс ПО имеет определенную оценку его полезности для ИС.
При неудовлетворении качества проекции отображаемой истинности ПО, данная ИС, с большей вероятностью, относительно предыдущего своего состояния или других ИС становится эволюционно менее эффективной в соответствии с принципом субъектности.
Формулировка постановки первого этапа задачи Проекта.
Изначально, в ПО каждому процессу соответствовала своя цепочка символов текстовой формы, которую будем называть элементарной семантической единицей. Затем в информационном канале они слились в непрерывный текстовой поток. Задача любой ИС заключается в том, чтобы прогнозировать этот текстовой поток и построить на нем свой словарь образов, соотнося эти образы ИС с процессами в ПО. Далее, исходя из причинной взаимосвязи (f(ПО), см. рис 1.), избирательно относиться к ТФ и, выдавая образы в ПО, научиться управлять процессами в ней, таким образом, чтобы максимизировать собственную эволюционную эффективность (см. ниже).
Прогнозируемость процессов в ПО определяется для ИС прогнозируемостью цепочек символов ТФ (образов).
Величина прогнозируемости цепочки символов в ТФ вычисляется величиной текстовой энтропии (ТЭ) ее образов (см. далее).
Образ - выделенная цепочка символов из ТФ. Поименованный образ хранится в памяти ИС.
Словарь образов ИС - совокупность образов, полностью покрывающая весть поток ТФ. Для хранения словаря образов требуется определенный объем памяти ИС, который будем называть материальным ресурсом ИС (R(ИС)).
Начальная произвольность выбора образа из непрерывного текстового потока порождает проблему комбинаторного взрыва числа возможных вариантов образов, составляющих словарь образов ИС.
Еще более остро комбинаторная проблема встает при структуризации текстового потока, отображающего причинно-следственную иерархию процессов в ПО. В этом случае задача построения иерархической структуры словаря образов усложняется многократно.
Функционально словарь образов ИС, с некотором смысле, "обратен" множеству процессов ПО. Ограниченное число объектов в ПО, порождает неограниченный текстовой поток, который покрывается ограниченным словарем ИС:
f(ПО) → процесс + процесс + … + процесс → ТФ =
= образ + образ + … + образ → словарь образов ИС. (1)
Перефразируя все вышесказанное резюмируем, что для большей эволюционной эффективности ИС должна: как можно большее число тактов времени ((t2-t1), см. рис. 2) и с возможно меньшими затратами материального ресурса (R(ИС)) управлять (как минимум, прогнозировать) развитием наиболее значимых для нее энергоемких процессов, отображаемых в форме цепочек символов, т.е. в образах.
Более формально, задача первого этапа Проекта определяется усредненной величиной ее эволюционного потенциала, который, в свою очередь измеряется интегралом величины энергетики всех контролируемых (прогнозируемых и управляемых) ИС процессов на интервале (t2-t1).
Рассмотрим пример. Допустим, в ПО три различных объекта. Предположим, что частотно процессы их взаимодействия характеризуются равномерным случайным распределением. Каждый процесс может быть представлен элементарными семантическими единицами (ЭСЕ). Предположим, что при парном взаимодействии объектов формируются следующие ЭСЕ: <МАК>, <РИС>, <ЛЕН>, и при тройном - <ДУБ>.
В информационном канале они сливаются в текстовую форму (ТФ): АКРИСРИСМАКДУБЛЕН …АКМ.
Предположим, что потенциальная энергетика каждого прогнозируемого символа равна 1Е+, время обработки символа - один такт, энергетические затраты на обработку одного образа в ИС равна 1Е−.
При том, задача ИС заключается в максимизации ее эволюционного потенциала. Для этого необходимо построить словарь образов, полностью покрывающий ТФ, и который бы давал ей этот наибольший эволюционный потенциал. Будем сравнивать усредненные характеристики вариантов на ТФ длиной в 12 символов. В нашем случае будем также предполагать, что каждые 12 тактов все образы R(ИС) потребляют на самоподдержание по 0,5Е− энергетической стоимости на образ.
Результаты эксперимента.
Первая структуризация словаря ИС (наибольший размер образа один символ): <М><А><К><Р><И><С><Л><Е><Н><Д><У><Б>: R(ИС)=12R*(0,5Е-/R) = 6E−, прогнозирование (Т) = 0Т(т.к. у образа только один символ), затраты энергии на распознавание = 12E−, контролирование потенциальной энергии ТФ = 0E+.
Итог: для односимвольного словаря = 18E−.
Вторая структуризация словаря (наибольший размер образа два символа). а) Минимальная форма словаря: <МА><К><РИ><С><ЛЕ><Н><ДУ><Б>: R(ИС)=8R =4Е−, прогнозирование = 0,5Т (на образ), затраты энергии на распознавание = 8E-, контролирование потенциальной энергии ТФ = 4E+.
Итог а)4Е− + (0,5Т * 8(образов на ТФ=12) = 4E+) + 8E− = 8E−.
б) Максимальная форма (без пересечения): <МА><КЛ><КР><КД><КМ> <ЛЕ>…<БД>: R(ИС)= 20R=10Е−, прогнозирование = 0,2Т (на образ), затраты энергии на распознавание = 20E, контролирование потенциальной энергии ТФ = 4E+.
Итог б) 10Е- + (0,2Т * 20(образов на ТФ=12) = 4E+) + 20E− = 26E− .
Итоговый лучший эволюционный потенциал = 8E− .
Третья структуризация словаря (наибольший размер образа в три символа). а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>: R(ИС)=4R =2Е−, прогнозирование = 2Т (на образ), затраты энергии на распознавание = 4E-, контролирование потенциальной энергии ТФ = 8E+.
Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.
б) Максимальная форма (без дублирования, т.е. без полного пересечения): <АКР><ИСР><ИСМ><АКД> <УБЛ><ЕНД> … <АКМ>: R(ИС)= 36R=18Е-, прогнозирование (Т) = 0Т (на образ), затраты энергии на распознавание = 36E-, контролирование потенциальной энергии ТФ = 0E+.
Итог б) = 54E- .
Лучший итоговый эволюционный потенциал = 2E+ , 54E- → 2E+(!!).
Четвертая структуризация словаря (наибольший размер образа в четыре символа). а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>: R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ), затраты энергии на распознавание = 4E-, контролирование потенциальной энергии ТФ = 8E+.
Итог а) = 2E+.
б) Максимальная форма (без дублирования): <АКРИ><ИСРИ><ИСМА> <АКДУ><УБЛЕ><ЕНДУ> … <АКМА>: R(ИС)= 48R=24Е-, прогнозирование (Т) = 0Т (на образ), затраты энергии на распознавание = 48E-, контролирование потенциальной энергии ТФ = 0E+.
Лучший итоговый эволюционный потенциал = 2E+ , 96E- → 2E+.
Пятая структуризация словаря. Лучший его итоговый эволюционный потенциал = 2E+ , 204E- → 2E+. … и т.д. !!!
Теоретический анализ результатов эксперимента показывает, что эволюционный потенциал ИС обратно пропорционален размеру словаря, при этом, размеры минимальных и максимальных словарей соотносятся как:
o(N) и o(N3) !!!, (2)
где: N – максимальный размер образа словаря
Широкий анализ различных минимальных словарей ИС показывает, что составляющие их образы гомоморфны элементарным семантическим единицам (ЭСЕ) процессов ПО [4,5,6]. Этот анализ подкрепляет утверждение (1), что процессы ПО и образы ИС принадлежат одному классу. Таким образом, признак минимальных словарей ИС (2) позволяет ИС строить объективное понимание процессов в ПО (как минимум, "говорить на одном языке").
Лемма 2. Чисто количественными методами (минимизацией размера покрывающего ТФ словаря) можно выявлять семантическую составляющую ПО.
Это второе основополагающее утверждение Проекта. Оно дает основание для формального связывания двух доселе разделенных миров ("мира материи и мира духа"), соединять которые до сих пор мог только homo-sapiens.
Резюмируя материал второго раздела отметим, что в нем:
- формализовано понятие Комплекса и его компонент ПО, ИК и ИС;
- введена единая энергетическая мера в Комплексе;
- показана универсальность текстовой формы представления информации (информационного ресурса);
- введены понятия эволюционной эффективности и эволюционного потенциала, а так же образа и словаря образов ИС;
- показан механизм выделения семантических понятий ПО, чисто количественными методами.
3. Структура информационного ресурса (сигнал – информация – знание). Характеристика нашей эпохи как информационной, при отсутствии четкого определения понятия "информация", вызывает естественное чувство "неуверенности и неловкости".
Вышеприведенные выкладки позволяют ввести формальные определение "сигнала" и "информации", как форм информационного ресурса.
Сигнал - символьный поток (ТФ), как суперпозиция элементарных информационных единиц ПО.
Информация - сигнал, структурированный на образы минимального словаря ИС, т.е. кратные элементарным информационным единицам ПО.
Если ИС способна структурировать ТФ на элементарные информационные единицы ПО, то она воспринимает информацию, если не способна, - воспринимает просто сигнал.
Другое важное понятие информационного ресурса - "знание". В нашем языке исторически уже сложилось понимание, что "знание" более ёмко, значимо и важно чем "информация". Чтобы подойти к определению "знания"необходимо рассмотреть не только задачу полной закраски ТФ, но и задачу по полному хранению ТФ в ИС.
Не имея возможности в рамках данной статьи также формально описать понятие "знание" как и "информацию", мы приведем лишь результирующее определение:
знание - совокупность пар образов, отражающих одновременно процессы ПО и процессы в самой ИС.
Введение понятия "знания" позволяет ИС на ограниченных ресурсах (R(ИС) - памяти) отображать и обрабатывать в памяти ИС без потерь практически неограниченные объемы ТФ и, при необходимости, выдавать их в ПО.
В рамках рассматриваемого комплекса: ПО → ИК → ИС, задача ИС заключается в том, чтобы:
- Воспринимать текстовую форму.
- Хранить информацию.
- Преобразовывать информацию в знание.
- Оценивать текущую информацию.
- Выдавать информацию (текстовую форму).
В зависимости от характера информационного ресурса: сигнала, информации или знания, различные классы ИС: "автомат", "животное", "homo-sapiens" могут получать (извлекать) из него минимум, который определяется либо содержанием ТФ, либо креативными возможностями ИС.
Так из сигнала типа "белого шума" все три типа ИС могут извлечь только "белый шум". Если ТФ представляет периодическую последовательность, то "ИС-автомат" воспримет только как ТФ, "ИС-животное" и "ИС-homo-sapiens" воспримут информацию в образе этого периода (например, <aaddccdd>).
Если же ТФ представляет, например, текст канала ТВ "Культура", то "ИС-автомат" воспримет ТФ только как "белый шум", "ИС-животное" - только как информацию (слова и фразы) и "ИС-homo-sapiens" - как знания.
Как уже понятно из данного изложения, ТФ как "сигнал", "информация" и "знание" в "ИС-homo-sapiens" могут различаться объективно. Различие заключается в динамической характеристике требуемого ресурса R(ИС) - памяти ИС для полного отображения ТФ. Графически это выглядит следующим образом (см. рис 5):
Рис. 5.
При постоянном потоке TФ = const (t) и t → 88, требуемый R(ИС) имеет четко отличительные характеристики fR = (RИС(ТФt)):
- " линейную":
- " логарифмическую":
- " const": |
fR = kt + RИС(0);
fR = log(t) + RИС(0);
fR = const, при t → 88. |
Краткое резюме материала третьего раздела:
- - введено объективное и формальное определение понятий "сигнала" и "информации";
- - дано со ссылкой определение понятия "знание" и приведены его характеристики;
- - продемонстрировано объективное различие "сигнала", "информации" и "знания" в ИС.
Заключение. В данном материале формально продемонстрирована возможность самозарождения информационных систем, способных к эволюционной самоорганизации.
Литература:
- Люггер Д.Ф. Искусственный интеллект. Стратегии и методы решения сложных проблем Издательство: Вильямс, 2003 г.864 стр.
- Сайт в Интернете - www.informograd.narod.ru/
- Бодякин В.И. Направленность эволюции информационных систем. //Всероссийский симпозиум "Современные проблемы неравновесной термодинамики и эволюции сложных систем", тезисы, 15-16 с, М., МАКС Пресс, 2004, 124 с.
- Бодякин В.И. Куда идешь, человек? (Основы эволюциологии. Информационный подход). - М. СИНТЕГ, 1998, 332с. http://www.ipu.ru/stran/bod/monograf.htm
- Бодякин В.И. Информационные иерархически-сетевые структуры для представления знаний в информационных системах. //Проблемно-ориентированные программы. Модели, интерфейс, обучение: Сб. трудов. – М.: Институт проблем управления, 1990.
- Бодякин В.И. "Семантические нейроподобные сети - следующий шаг нейрокомпьютинга" // сб. (круглый стол) "Нейрокомпьютеры 10 лет спустя" МИФИ, 2000г.
- Бодякин В.И. Восхождение разума - www.informograd.narod.ru/pub_kn.htm
Для замечаний
|