Механизмы эволюции информационных систем

Пролог Нейросемантика


Бодякин В.И.

МЕХАНИЗМЫ  ЭВОЛЮЦИИ 
ИНФОРМАЦИОННЫХ  СИСТЕМ 

(На правах рукописи от 23.05.06.)

Институт проблем управления РАН им. В.А. Трапезникова, Москва
body@ipu.ru , http://www.informograd.narod.ru , служ.тел.:334-92-39

 

Введение.

В век информатики пора разобраться, что же представляют из себя информационные системы (естественные биологические, технические и социальные) и каким образом им надлежит развиваться в будущем, чтобы не входить в противоречие с общим руслом глобальной эволюции высокоорганизованной материи. Попытаться понять информационные системы можно с различных уровней глубин осмысления их сущности и различных степеней детализации.

В нашем рассмотрении можно ограничиться техническими информационными системами, и это будет правильно, так как только "потребительское" знание и оплачивается. Можно из любопытства, кончено, заглянуть чуть дальше или чуть шире, но это уже за счет самого исследователя.

В древности строительство было искусством и полностью зависело от интуиции мастера. Иногда получались шедевры, иногда, уже при возведении, замысел превращался в груды глыб и пыли. Когда же такие науки, как геометрия и физика доходчиво объяснили получаемые результаты, то искусство строительства обрело технологию и перешло в разряд ремесла. Сегодня строитель получает готовые детали и собирает из них проекты "как из кубиков", и он так этим увлечен, что забывает, что есть исходные компоненты: цемент, вода и наполнители, и из них можно построить любые детали для совершенно новой конструкции, может, для той, о которой он мечтал в детстве.

Лично я считаю, что чем с более глубоких основ можешь взглянуть на свою деятельность, то тем более уверенно будешь ее знать и чувствовать. Около двух тысяч лет назад Демокрит предположил, что весь мир состоит из атомов, и только в восемнадцатом веке это подтвердилось, далее по сегодняшний день эстафета "атомов" передавалась молекулам, атомам, кваркам. Есть гипотеза, что "атомы" как неделимые частицы материи - это "амеры", то, из чего состоит все. Они гипотетичны и ни к чему не обязывают. Они просто придают твердость почве дальнейших материалистических построений и позволяют ввести меру всему остальному.

Если такой подход кому-либо покажется заумным философствованием, то он может опускать эту "заумь". Многие из моих коллег также не принимают "амеров", это их право, так же как и мое - попытаться донести до других "своих соплеменников" ту истину, которая открыта мне.

В данной работе показаны возможности развития нелинейных процессов в физической предметной области и анализируются эволюционные следствия, к которым они приводят, в частности, "как из звезд рождаются люди".

Если же для Вас все эволюционные хитросплетения не представляют никакого интереса, то можете спокойно пропустить этот раздел.


Пролог. Все началось с Большого взрыва. Взрыв, мощностью порядка в 10100 эрг, породил пространство и материю в форме самых простейших материальных 0-мерных частиц, назовем их амерами. Это были своеобразные биты материи. По мере расширения пространства образуемой Вселенной, происходило ее постепенное охлаждение и конденсация вещества (амеров) в более сложные материальные образования: элементарные частицы, атомы, молекулы. Из них уже сформировались галактики, звездные скопления и планетарные системы, на которых, в свою очередь, сформировалась сложные молекулярные образования, давшие начало процессам саморазвития, что мы теперь называем жизнью. Процесс саморазвития данных материальных образований и его механизмы является предметом изучения данной статьи.

 

Часть I
Зарождение  и  эволюция  простейших  информационных  систем 

Для изучения механизма появления и эволюции информационных систем предложим лингвистическую модель описания (отображения) эволюционного процесса материи и сделаем в ее рамках следующие десять предположений.

Предметная область.

1. Любой физический процесс может быть отображен в многомерном параметрическом пространстве (W(t)). Каждая его проекция по какому-либо параметру (Wi(t)), где t - время, может быть представлена текстовыми последовательностями (цепочками) символов конечной длины некоторого алфавита Аi = {A,B,C,…,Z} [1]. Для упрощения, мы будем рассматривать только проекцию i(t)) процесса и поэтому в дальнейшем исследовании опустим i-й индекс.

Для простоты предположим, что любой физический процесс конечен, т.е. амплитуда W(t) начинается и заканчивается (W(t1)=0, W(t2)=0), или же он состоит из (под)процессов конечной длины. Амплитуда изменения параметров процесса W(t) отображается в данном алфавите А с задаваемой, или физически допускаемой дискретизацией ΔW = W / |A| точностью, а число символов отображаемого процесса определяется длительностью процесса t2 - t1  и выбираемой, или физически допустимой, его дискретизацией по времени Δt [1]. Очевидно, что произвольный физический процесс (любой размерности), можно взаимооднозначно отобразить в текстовую форму и обратно отдельно по каждому параметру, с любой наперед заданной степенью точности (соответствия) [7].

Таким образом, при анализе и моделировании произвольных процессов достаточно использования только их текстовых форм (см. рис. 1г.), на которые и ориентирована всем своим процессом развития наша цивилизация, и что является наиболее предпочтительной коммуникационной формой во всех отношениях. Наш язык подтверждение этому.

 

Рис. 1.
Рис. 1.

 

2. Под внешней средой (предметной областью - ПО) будем понимать физическую среду, представленную совокупностью из n {a1, a2, …, an} различных типов некоторых гипотетических объектов. Пространство ПО дискретно и разбито на m ячеек (m >> n), в каждой из которых может находиться объект ai. Для среды задаются ее начальные условия (число объектов, координаты и векторы их скоростей). При попадании нескольких объектов в некоторый такт времени в одну и ту же ячейку происходит процесс их взаимодействия, см. рис. 2.

Рис. 2.
Рис. 2.

3. Допустим, что в ПО возможно одновременное взаимодействие не более, чем d объектов ("пар", "троек", … , "d"). В d-мерном кубе описываются процессы взаимодействия любых объектов {a1, a2, …, an} ПО, которые отображается в текстовой форме элементарными семантическими единицами Su ={s1, s2, …, su}, где u ≤ nd.  Например, взаимодействие пары объектов ai и aj порождает элементарную семантическую единицу <CADE…B>, см. рис. 3. Этот d-мерный куб представляет всю "конституцию" ПО.

Рис. 3.
Рис. 3.Рис. 3.
мное ядро проекта - нейросемантическая форма представления информации, уже реализовано в виде (форме)

4. Во всех реальных ПО выполняется принцип причинности и принцип подобия. Сущность первого заключается в том, что существует строгая последовательность следования (хода?) физического процесса - причины и затем вызванного ею физического процесса - следствия (например, CCB,V → CBBDDWW), причем эти причинно-следственные отображения инварианты в пространстве и времени. Принцип подобия выражается в том, что текстовые схожести физических процессов (например, CBBDDWW ~ CBBDDXW) в большинстве случаев (описанных в "конституции" ПО) порождает и близкие их схожести следствия.

5. Предположим выполняющимся следующий ряд энергетической активности процессов ПО, отображаемых символами алфавита А: A>B>C>…>Z=0, т.е. - А1> А2> А3 >…> Аz. В качестве примера такого энергетического ряда можно предложить: амер > кварк > элементарная частица > химический элемент > молекула >…> тепловой фон ПО.

6. Внесем динамику процессов в ПО вводом энергетической неустойчивости символов алфавита А. Суть ее заключается в том, что каждый отдельный символ, отображающий физический процесс в ПО, с вероятностью b (например, β=0,5) за интервал времени ΔТ1 распадается на другие символы в направлении ряда энергетической активности (например, если мы примем переход как преобразование Аi→(Аi+k)*2k Z, то тогда: A→BB Z; B→CC Z; C→DD Z; … Y→ZZ Z;). В результате энергетическая неустойчивость символов способна порождать в ПО длинные причинно-следственные цепочки:

Рис. 4. 

Рис. 4.

Эти цепочки представляют разнообразные слова-процессы, получаемые в результате данного естественного процесса в ПО. Среди слов-процессов могут быть и очень сложные, отображающие функционирование физических систем различной сложности.

6.1. Для полноты картины предположим и возможность преобразования, обратного ряду энергетической активности, например, (Аi−k)*2k+1 → АiZZZ…Z. Так, при этом соответствии получим: BBBB→A(Z)*2|A|; CCCC→B(Z)*2|A-1|; … YYYY→X(Z)*2|A-24|;  ZZZZ→ZZZZ). Предположим, что данный процесс проходит с вероятностью, например, - 0.99.

Включение в рассмотрение данного обратного процесса необходимо лишь для того, чтобы у сложных саморазвивающихся структур ПО (информационных систем) была возможность изучить начала данной ПО.

6.2. Сделаем еще одно предположение, что процессы, отображаемые символами в левой части алфавита А: A и B <космические лучи>, очень "высокоэнергетичные" и разрушают любые длинные цепочки-процессы, с которыми они встречаются. Например,  В СЕТО → СС  СЕ ТО.  В средней части алфавита C - <свет> самый энергоемкий, не разрушающий другие цепочки процесс; … ;. Последний символ алфавита Z - <тепловой фон> с нулевой возможностью совершения работы и, соответственно, с максимальным значением физической энтропии [ ].

7. Приближая нашу модель к реальности (за прототип взято авторское знание о Вселенной), внесем еще дополнительные свойства ПО. Допустим, что если в сформированной цепочке суммарное количество "гласных" и "согласных" (четных и нечетных) символов оказывается равным, то "период полураспада" символов в этой цепочке становится равным ΔТ2  (ΔТ2 >> ΔТ1). Такие "долгоживущие" цепочки назовем веществом. Обычные, короткоживущие цепочки (с "периодом полураспада" символов равным ΔТ1) назовем  энергией. Финальные цепочки (ZZZZ…ZZ) "теплового фона", обладающие нулевой энергоемкостью,  назовем физическим пространством ПО.

Кажущееся количественное нарушение при порождении новых символов в процессе преобразования (в соответствии с рядом энергетической активности)  Аi→(Аi+k)*2k Z снимается предположением, что каждый родившийся в процессе преобразования символ порождает и свое дополнительное пространство (Z), так A(Z)→ B(Z)B(Z) Z. Если же мы начнем с Большого взрыва, когда одновременно каким-то образом сформировалась некоторая "сингулярная область", состоящая из процессов А…А (например, из 10100 А), то мы приходим к модели "расширяющейся" ПО со всем ее современным разнообразием вещественных и энергетических форм материи.

7.1. Вещественные цепочки мы будем также называть привычным для нас определением - физическими системами. Понятно, что в описанной нами ПО возможно очень большое разнообразие физических систем. Из теории самовоспроизводящихся автоматов фон-Неймана известно, что для построения простейших самовоспроизводящихся автоматов необходима сложность физических систем не менее, чем в 26 компонент (которые, в свою очередь, состоят из десятков элементов) [ ]. Опыт компьютерных вирусов показывает, что для простейших из них достаточно 300 символов, что также относительно немного при указанных начальных ресурсах ПО [ ]. Таким образом, в рассматриваемой нами модели ПО среди различных физических систем с достаточно большой вероятностью случайно формируются и достаточно сложные физические системы (см. рис. 4).

Информационные системы.

8. Сложную физическую систему назовем эволюционирующей информационной системой (ИС), если она обладает определенной структурой (см. рис. 5) и способна средне статистически, посредством воздействий на внешнюю среду (ПО) переходить в более "благоприятные" для нее ситуации, нежели при ее пассивности. Под "благоприятными" для ИС ситуациями будем рассматривать такие, в которых либо растет в ПО количество ИС (и чем больше их количество, тем более "благоприятными" будем считать условия для ИС), либо увеличивается область ее ареала (область пространства ПО, управляемая ИС) в ПО.

Рис. 5.
Рис. 5.

Структура ИС может быть распределенной или симбиотической, когда некоторые ее устройства совмещены (например, рецепторы-ввода и память) или же, вынесены вне ее физического тела (например, устройство копирования ИС), но полный набор, представленный на рис. 5, должен функционировать целостно.
Так, например, во всех вычислительных системах функцию их копирования и энергетической обеспеченности выполняет человек, замыкая тем самым в целостное функционирование определяемых ИС. Поэтому, имея возможность распределять функции ИС, что характерно для рукотворных ИС, будем подробно рассматривать только значимые на данный момент устройства и их характеристики, не акцентируя внимание на целостности их функционирования в системе.

Механизм функционирования ИС достаточно прост. На ее вход поступает "слово-процесс". Устройство управления сравнивает его с имеющимися "словами" в устройстве памяти и решает, как реагировать на него: или игнорировать, или обработать его, получив в результате некоторое количество энергии, и затем передать его на выход в более низкой энергетической форме. Например, слово <СЕТОЕE> на входе ИС и переработанное слово <SOSOТЕ> на ее выходе, в соответствии с (1) в пунктах 9.2 и 8.3, см. далее. При наличии достаточного количества энергии в энергетическом блоке, в соответствии с программой устройства управления, ИС порождает свою копию, выдавая ее в ПО.

8.1. В зависимости от размера воспринимаемого алфавита ИС (АИС ≥ А)  и максимальной длины воспринимаемых ею слов-цепочек определяется ее информационное пространство (ИП), см. рис. 6.

Рис. 6.
Рис. 6.

     На данном рисунке представлены примеры ИП:
а) одномерное - односимвольные образы (a,...), где 1-я ось = АИС = {a,b,c,…};
б) двухмерное - двухсимвольные образы (aa,...) - 1-я и 2-я оси;
в) трехмерное - трехсимвольные образы (cbb,...) - 1-я, 2-я и 3-я оси;
г) и т.д.  ...  .

В качестве примера контуром выделено информационное подпространство:  АИС=3, L=2. Число всевозможных слов-цепочек = АИС L=9.

Таким образом, чем больше алфавит АИС  и больше мерность воспринимаемого информационного пространства, тем больше различных слов доступно ИС, и тем потенциально большие энергетические ресурсы ПО доступны.

8.2. ИС назовем эволюционирующей, если можно указать механизм ее модификации, при котором за ограниченное время t < Тu (время существования Вселенной Тu ~ 1018 сек) она потенциально способна расширить свой ареал на все физическое пространство Вселенной Ru (сфера с радиусом Ru ~ 1010 световых лет).

8.3. Мерой эволюционного потенциала ИС будем считать ее управляемый энергетический потенциал как суммарную энергетическую разность входных и выходных цепочек (см. далее пункт 9.2). Энергетический потенциал, в свою очередь, может направляться ИС на перемещение в пространстве ПО на конструирование данной ИС, на внутреннюю работу и на создание копий ИС (см. выше пункт 8). Естественно, что копирование проходит не абсолютно точное, и вкрадывающиеся отклонения (мутации) порождают новые конструкции ИС, которые в своем большинстве менее эффективны с позиции эволюционного потенциала. Но могут встречаться и более эффективные относительно ИС-прародителя, тогда из них возникают лидирующие конструкции ИС.

8.4. Для лидеров ИС открываются возможность "снятия сливок", так как они могут выбирать, в соответствии со своей конструкцией для данной ПО, самые энергетически эффективные для них цепочки-процессы, которые только присутствуют в ПО. А это необходимые условия для ИС экспансии (по числу копий и по ареалу влияния) в ПО. Следовательно, функция, которую выполняют в ПО простейшие ИС  - это экспансия.

8.5. Но в общем случае это тупиковый путь, так как, когда "выгорит" весь начальный энергетический потенциал ПО, то все, в том числе и ИС, также распадутся, превратившись в Z-цепочки. Поэтому, в качестве еще не осознаваемой задачи ИС можно считать управляемый запуск процесса (см. выше пункт 6.) …→ АААА → Большой взрыв … → выход за пределы ПО (Вселенной). Только в этом случае у ИС еще остается перспектива на эволюционное будущее.

9. Дополним характеристики физических процессов в ПО их "многослойностью" (многомерностью), которая заключается в индуцировании ими многомодальных следствий, часть из которых распространяется с пространственными скоростями, превышающими скорость распространения определяющих этот процесс следствий. Так, например, соединение двух объектов (веществ) вызывает <ВЗРЫВ>, который в свою очередь вызывает: <вспышку>, <хлопок>, <ударную волну>, <химическое воздействие>. Значимые ("благоприятные" и "неблагоприятные") следствия для ИС назовем энергетическими, а предвосхищающие их появление - сигнальными и обозначать их будем в угловых скобках прописными и малыми символами. Таким образом, будем разделять энергетические и сигнальные компоненты физических процессов ПО.

Так, в соответствии с вышеприведенным примером, после восприятия <вспышки> удаленного <ВЗРЫВА> ИС, посредством устройства управления, способно избежать "неблагоприятных" для себя последствий <ВЗРЫВА> - <УДАРНОЙ ВОЛНЫ>, подавая на свое устройство вывода <ДВИЖЕНИЕ>. Т.е. энергетической (физической) компоненте распространяемого процесса в пространстве ПО, на расстоянии от него обычно предшествует его сигнальная(информационная) компонента, и это свойство предшествования может быть использовано ИС для ее избирательного воздействия на ПО (основа для эволюционного поведения ИС).

9.1. Распределение цепочек с позиции "благоприятности" для ИС можно ранжировать следующим образом: <Е0 >  >>  <Е- >  >  <Е+ >, т.е. подавляющее большинство цепочек "бесполезны" (Е0) для ИС, далее много "вредных" (Е-) и немного "благоприятных" (Е+). Причем, "благоприятные" можно также ранжировать по степени благоприятности, например, может быть, <CODE>  <KOLERE>   >  …   <WOKIWYRY>, в соответствии с пунктом 6 (см. выше).

9.2. Энергоемкость цепочек ПО будем оценивать как алгебраическую сумму составляющих их символов. Если принять, что Z=0, а Y=1 энергетических единиц, то в соответствии с пунктом 6, X=2, W=4, … A=2|A-1|, т.е. А2|A|A-i-1|| .

 

Соответственно, энергоемкость слов-цепочек равна:

9.3. Знак воздействия слов-цепочек (Е0, Е- или Е+) для ИС определяется конструктивной настроенностью на них самой ИС.

9.4. Полезная энергия, использованная ИС, определяется как разность энергоемкости воспринятого и выданного в ПО слова-цепочки.

9.5. Допустим, еще одно свойство некоторых цепочек при взаимодействии с определенными цепочками изменяет свой период "полураспада". Устойчивые энергетические цепочки <ЭНЕРГИЯ> при взаимодействии с <катализатором> ИС за интервал времени ΔТ3 (ΔТ3 << ΔТ1<<ΔТ2, см. выше пункт 7.) распадаются на менее энергетические цепочки <ЗОЛА> и <ДЕЙСТВИЕ>. Управляя подачей <катализатора> при определенных состояниях внешней среды, ИС способна целенаправленно функционировать в ПО.

9.6. Дополнительно к свойствам ПО, обозначенным в пункте 4, добавим еще свойство инерционности, суть которого заключается в том, что потенциальная частота смены состояний ИС много больше, чем скорость изменения  состояний ПО, т.е. характеристики ПО должны быть более инерционны, чем скорости управления ИС.

10. Можно рассмотреть два случая начального исходного состояния ПО.
1-й  случай. Начальное распределение цепочек  в среде ПО имеет следующий вид: N00)  >  N++)  >  N--), т.е. среднестатистическое число  "благоприятных" для ИС  (N+) больше, чем "неблагоприятных" (N-). В этом случае возможна упрощенная реализация конструкции псевдо-ИС без памяти и устройства управления, так как, реализуя всеядность такой конструкции, интегрально она получает положительное энергетическое приращение (N++)  + N--) >0). Соответственно, вероятность случайного появления первой такой конструкции в среде (ПО) существенно повышается. Далее она тиражируется. При этом происходит обеднение среды: N00) > N--) > N++).

2-й  случай. Он характеризуется следующим начальным распределением цепочек: N00) > N--) > N++), т.е. среда более "неблагоприятна", чем "благоприятна" для ИС.  В такой среде (ПО) могут существовать только полноценные ИС, см. рис 5. Если же состояние ПО изначально удовлетворяло 1-му  случаю, то вероятность случайной организации полноценной ИС будет больше, чем, если бы ПО изначально была "неблагоприятна" для ИС (N--) > N+(Е+)). Ступенчатый же процесс эволюции материи до состояния ИС более вероятен.

 

Теоретические выводы, вытекающие из рассмотренной модели ПО.

Вывод №1. Простейшие ИС могут образовываться случайным образом за ограниченное время в ПО с рассмотренными характеристиками (см. пункты 1-9  и 7.1).

Пример. Известные опыты по получению органических соединений из неорганических при воздействии на них электрических разрядов. Самые простейшие ИС - это некоторые белковые молекулы.

Вывод №2. В соответствии с пунктом 8.1, размер ИП воспринимаемого ИС равен размеру ее рецепторного алфавита (АИС) в степени максимальной воспринимаемой длины (L) слов-цепочек  (АИС L). А так как потенциальная энергоинформационная емкость слов-цепочек пропорциональна их числу, то потенциальный эволюционный потенциал ИС зависит от размера ее рецепторного алфавита (АИС) в степени их максимальной воспринимаемой длины (L). Следовательно, в данной ПО будет наблюдаться процесс роста сложности воспринимающей части ИС (своеобразная "цефализация" простейших ИС). При этом, если эволюционная эффективность потенциально возрастает как степенная функция, то "утяжеление" ИС за счет уменьшения надежности и дополнительных внутренних энергозатрат растет лишь как линейная функция. Т.е. необходимое усложнение информационного аппарата ИС дает ей существенные эволюционные преимущества. Этим и определяется направленность эволюции.

Начальный импульс направленности эволюции для простейших ИС определяется положительной разностью энергетической емкости слов-цепочек и энергетических затрат на поддержание функциональной целостности ИС (см. пункты 9.2 - 9.4).

Пример. Данные палеонтологии подтверждают (этот) вывод №2.

Вывод №3. Скорость эволюции ИС отображается степенной функцией.

Примеры. Скорость биологической эволюции на Земле отображается степенной функцией. Это можно проследить на качественном изменении конструкций высокоорганизованной материи в форме биологических организмов: возникновение жизни на Земле - миллиарды лет; первые позвоночные - сотни миллионов лет; первые млекопитающие - десятки миллионов лет; первые люди - миллионы лет. Ускорение каждого этапа в 10 раз. В нашей модели обобщенный алфавит А = 10, а каждый качественный скачок -это дополнительное измерение (длина обобщенной текстовой цепочки L= 1,2,3,4).

Рассматривая пример социальной эволюции, также получаем 10-ти кратное ускорение качественной смены социально-экономических форм: история цивилизации началась с эпохи собирательства и овладения огнем и продолжалась сотни тысяч лет; эпоха охоты и скотоводства длилась десятки тысяч лет; эпоха земледелия - тысячи лет; эпоха индустриализации - сотни лет. Ради любопытства можно экстраполировать этот ускоряющейся ряд смен социальных форм, и мы приходим к выводу, что эпоха информационного общества будет длиться десятки лет, а эпоха Ноосферы - всего несколько лет (?!). А далее должен быть эволюционный фазовый переход к совершенно новой форме высокоорганизованной материи (???).

Такой же результат степенного (экспоненциального) приращения дает и количественный анализ по параметру возрастания радиуса ареала обитания биологического организма: растение - метры; животное - тысячи метров; человек - тысячи километров.  Здесь: А = 1000;  L= 1,2,3.

Развитие человечества по экспоненте, как лидирующего вида, говорит о свободности (незанятости) структурно вышележащих экологических ниш ПО, что, в свою очередь, подтверждает конечность существования нашей вселенной и, соответственно, гипотезу Большого взрыва ("мы одиноки во вселенной" [ ]).

Вывод №4. Эволюционные скачки видов-конструкций ИС объясняются мутациями в ее информационной части конструкции, что характеризуется степенной функцией, и затем мутациями в остальных ее частях конструкции, которые характеризуются уже линейной функцией, что, соответственно, за длительный период и порождает большие пласты "палеонтологического" материала.

Пример. Данные палеонтологии говорят о чрезвычайной неравномерности морфологического изменения биологических видов за геологические периоды.

Вывод №5. Эволюционно лидирующая ИС, выедая энергетические сливки ПО, меняет ее характеристики, порождая в ней (выдавая) биогенные "тексты-отходы".

Если лидирующая ИС полностью выбрала все "сливки", то идущая вслед за лидером ИС2 вынуждена переходить на "тексты-отходы" от ИС или менее энергоемкие тексты, при этом ее информационный аппарат (устройство ввода, управления, вывода) будет упрощаться и этим определяется инволюционная направленность ИСi.

Инволюционировавшие (деградирующие) конструкции ИСi начинают оттачивать эффективность неинформационных устройств ИС.

Если лидирующая ИС не полностью выбрала "сливки", то конструктивно идущая вслед (по сложности информационной части) за лидером ИС2 , может еще и обойти ее при более удачных мутациях конструкции.
Пример. Homo-sapiens, как всеядная ИС, не оставила шанса другим типам  ИСi  по смене эволюционного лидера на Земле.?

Вывод №6. Скорость эволюции ИС определяется, в основном, конструкцией ее информационной части как АИСL. Поэтому для лидирующей ИС более предпочтительно брать первую конструктивно доступную энергетическую разность между входными и выходными словами-цепочками (см. пункт 9.5). При большом разнообразии слов-цепочек ПО лидирующая ИС начинает специализироваться на определенных словах-цепочках. Любая полная энергетическая переработка утяжеляет ИС, уменьшая ее эволюционный потенциал и делая ее менее конкурентоспособной в ПО. Поэтому порождаются различные по конструкции виды ИС - "дерево эволюции".

Пример. Не существует биологических организмов, перерабатывающих энергетическую компоненту полностью, от максимальной (C,D,E) до Z. Хотя для симбиозов ИС это обычное явление. Но в симбиозах естественна и обязательна иерархия ИС.

Вывод №7. Механизмы инволюции и специализации приводят к нарастающему конструктивному расхождению "видов" ИС в ПО.

Пример. Генетическая "нескрещиваемость" близких биологических видов хорошо подтверждает это.

Вывод №8. Механизмы инволюции и специализации приводят к образованию "симбиозов" ИС.

Пример. Это хорошо видно на многочисленных биологических и социальных примерах. Не существует доступного для ИС и неиспользуемого ими энергетического ресурса. Так, естественная радиоактивность (см. пункт 6.2, A = A, B) не используется непосредственно биологическими организмами, но ИС (последняя модель Homo-sapiens), посредством внешних энергетических устройств, уже приспособилась использовать и этот энергетический ресурс.

Вывод №9. Информационная (сигнальная) и энергетические компоненты ПО очень тесно взаимопереплетаются в ИС.  "Информация - потенциальная энергия ПО (Вселенной)".

Вывод №10. В простейших ИС нет целевой функции как некого физического устройства, просто в ПО существуют энергетические аттракторы, в которые и сваливаются эволюционирующие ИС.

Значения прошлых аттракторов ПО переходят в "генетическую" память ИС и закрепляются в ее устройстве управления. Таким образом, "интеллектуальный первотолчок" в ИС приходит извне, из материального мира (ПО). Это внушает нам надежду проследить и промоделировать дальнейшее эволюционирование "интеллектуальных" функций ИС.

Пример. Приведенные на рис. 5 компоненты ИС, как проекции ее обобщенной целевой функции ("эволюция"), фактически являются локальными целевыми функциями ИС, которые "генетически" включаются на разных этапах ее развития и функционирования. Например, рост блока ввода на начальных этапах, затем рост блока памяти, далее - рост блоков вывода и энергетического и на завершающем этапе - рост блока копирования. Затем все повторяется с некой генетической мутацией и т.д.

Вывод №11. Оптимальная эволюция ИС, в смысле наискорейшего решения задачи эволюции ИС (см. пункт 8.5), - это определяющая ("нравственная") роль в развитии информационных устройств.
Пример. Все социальные системы, ориентированные на приоритетный прирост знания, становятся лидерами в своем ареале.

Вывод 12. Первые прото-ИС имеют преимущество появления в более "благоприятных" средах  ПО
(
N++)  >  N--)). Меньше конструкторского ресурса на саму ИС. (см. пункт 10).

Вывод 13.  В "благоприятных" ПО память и устройство управления у прото-ИС могут быть минимальны или вообще отсутствовать.

Примеры. 1. При индивидуальном развитии ИС в семейной  "благоприятной" среде на начальной стадии развития ИС имеют преимущества органы восприятия информации.

2. Социальные культуры, развивающиеся в "благоприятных" средах, более чувственны, чем логичны.

Вывод 14.  После появления первых прото-ИС, "благоприятные" характеристики ПО меняются на "неблагоприятные": <Е0>>  <Е->  <Е+ >, и эволюционирование в такой сложной среде уже возможно только при наличии у ИС памяти, так как она позволяет делать отбор вариантов состояний из Е+, что дает ИС эволюционные преимущества.

Вывод №15. Можно построить компьютерную программу, которая сымитирует описанную модель ПО с самозарождением и эволюцией в ней простейших ИС.

Вывод №16. Эволюция физических систем - возрастание энтропии и тепловая смерть. Эволюция информационных систем - прогресс, восхождение.

Перейдем теперь к рассмотрению эволюции нелинейных информационных систем.

 Часть II
Эволюция  нелинейных  информационных  систем 

Как мы установили из материала первой части, определяющим основные эволюционные характеристики ИС является ее блок информационных устройств (БИУ) - это: устройство ввода (УВВ), память (УП) и устройство управления (УУ) (см. рис. 5). Энергетическое устройство (УЭ см. ниже формулу 2), устройство копирования (УК) и устройство вывода (УВ) составляют вспомогательный блок (ВБ), который дает лишь линейный член в приращении эволюционного потенциала (ЭП), тогда как устройство ввода (УВВ) информационного блока (БИУ) дает степенное приращение ЭП на каждый дополнительный элемент УВВ (см. вывод №3).

ЭП  = БИУ - ВБ  =  f( f(A), f(L))  + ЭИС  - MP(БИУ) - MP(ВБ)  =

 = (f(A))f(L)  + ЭИС -  MP(УВВ + УП + УУ + УЭ + УК + УВ )                    (2)

Где: A - мощность воспринимающего алфавита ИС,

L -  воспринимаемая длина символьных цепочек,

AL  - информационное пространство ИС (см. пункт 8.1),

ЭИС- потенциальная (управляемая) энергия ИС,

MP - число конструктивных элементов ИС (материальный ресурс).

Пока ИС мала и стоит в начале эволюционного пути (прогресса, восхождения) все ее устройства имеют простую организацию, и потенциальная экспоненциальная емкость информационного пространства ИС никак не может проявиться. Эволюционный прогресс на этом этапе идет практически линейно, и только за счет положительной разности энергетической емкости слов-цепочек и энергетических затрат на поддержание функциональной целостности ИС (см. пункты 9.2 - 9.4).

На этом этапе, блок информационных устройств ИС начинается с развития (рецепторов) устройств ввода (УВВ), которые одновременно выполняет функции устройств управления (УУ) и памяти (УП). По мере эволюционного развития ИС, наибольшая динамика прироста блока информационных устройств (БИУ) переходит к памяти (УП). На уровне ИС-животное, память ИС становится самым ресурсоемким устройством БИУ по затратам материального ресурса (MP).

Память ИС, на этом этапе, фактически хранит образцы внешних слов-цепочек. Ее структура линейна, т.е. затраты материального ресурса (MP) на хранение в ней образов внешних слов-цепочек s пропорциональны их числу Σsi, или же их суммарной символьной длине, т.е.:

MP(УП)  =  k * Ssi   + ConstУП                                  (3)

Соответственно, линейная структура памяти ИС становится самым перспективным объектом эволюционных метаморфоз, тем более, потенциально она может иметь нелинейную, а именно, иерархическую структуру, что увеличит ее емкость в степенной функции (число запомненных слов-цепочек s) при тех же самых материальных затратах

Вторым основанием для перехода к нелинейной структуре памяти является структурная организация длинных цепочек. Порождаемые в ПО цепочки-процессы, согласно пункту 4 (см. выше), подчиняются принципу причинности и выстраиваются в длинные причинно-следственные цепочки-предложения, которые всегда заканчиваются для ИС значимым для нее процессом ("вредным" - Е-  или "благоприятным" - Е+). Цепочки-предложения состоят из отдельных, часто повторяющихся слов-цепочек.

Вполне очевидно, что хранить эти s-образы внешней среды экономнее в виде словаря слов-цепочек с указанием их последовательности в цепочках-предложениях. Таким образом, формируется иерархическая нелинейная структура памяти ИС.

В качестве примера рассмотрим случай, когда цепочки-предложения состоят из k слов-цепочек. Общее число всех слов-цепочек равно N. Соответственно, общее число всевозможных цепочек-предложений равно Nk.

Рис. 7.
Рис. 7.

Общие затраты материального ресурса (MP) в битах-амерах на память ИС в линейном варианте будут равны:  

 
MPИС(ЛИН)= Nk *  k * L * Лем_верхн_пред.log AПрав_верхн_пред.                                    (4)
Где:
L - средняя длина слов-цепочек,
Верхн_предел - знак ближайшего целого
(4)  

Затраты материального ресурса (MP) на память в нелинейном варианте будут равны:

MPИС(НЕЛИН) = N * L + MPИСС                                            (5)

При этом нелинейная память ИС строится на базе словаря слов-цепочек, увязанных в иерархически-сетевой структуре (ИСС):

                      
Рис. 8.
Рис. 8.

 

Материальные затраты на MPИСС можно оценить как:

MPИСС = Nk *  k * Лев_верхн_пред.log AПрав_верхн_пред.,                                                           (6)

а так как для физических ПО всегда выполняется принцип причинности, и, как следствие, количество слов-цепочек N неизменно много меньше их возможного числа размещений с повторениями равного AL  (N << AL), то материальные затраты нелинейной памяти, при той же емкости, будут меньше:

Рис. 7.                                  (7)

Где: α - характеристика текстовой вырожденности ПО,
обратная мера ее текстовой энтропии.

При длинных цепочках-предложениях можно строить еще один уровень иерархически-сетевой структуры (ИСС), тем самым сокращая необходимые материальные ресурсы еще вα раз, что в итоге даст уже α2раз.

При обработке сверхдлинных цепочек-предложений можно еще надстраивать уровни ИСС, тем самым увеличивая эффективность расхода материальных ресурсов памяти в α3 раз, - в α4 раз и т.д., в зависимости от обрабатываемых объемов сигнальной информации, приходящей из ареала функционирования ИС.

При этом наблюдается парадоксальная ситуация: чем больше объемы обрабатываемой информации ПО, тем с большей эффективностью она хранится в ИС. А так как объемы памяти ИС напрямую связаны с ее эволюционным потенциалом (см. вывод №3), то на практике мы и наблюдаем степенной характер ускорения эволюции ИС. Уменьшение удельной ресурсоемкости памяти ИС приводит к уменьшению энергозатрат на ее обслуживание и к ускорению реакции ИС, что в соответствии с (2), лишь дополнительно увеличивает ее эволюционный потенциал (ЭП).

Появление нейроподобного N-элемента как конструктивного элемента памяти открыло возможность построения памяти ИС в виде иерархически-сетевой структуры (ИСС) с практически неограниченной емкостью.

N-элемент - это пороговый конечный автомат, имеющий k входов и один выход, который активируется, когда по k входам приходят в заданной последовательности сигналы от активизированных рецепторов или таких же как он N-элементов, это и означает, что данный N‑элемент распознал на своем входе хранящийся в нем образ текстовой цепочки. Таким образом, в N-элементе отражаются причинно-следственные процессы (текстовые цепочки).

Рис. 9.

 

N-элемент представляет из себя простейшую неавтономную ИС, или, точнее, ее основной функциональный элемент. Схемами на базе из N-элементов можно моделировать не только любые логические схемы, включающие "и", "или", "не", но и безусловный и условный рефлексы.
В работах [1-7] достаточно подробно описаны N-элемент и его свойства, а также ИСС, поэтому для более детального знакомства с ними отсылаем читателя к названной литературе. Наиболее подробно развернуто описание нелинейных ИС в [1,6], ее мы рекомендуем для "продвинутых" читателей. Вся названная литература выложена в Интернете [7].

Вывод №17. Организация памяти ИС в виде иерархически-сетевой структуры (ИСС) возможна только на базе пороговых нейроподобных N-элементов.

Вывод №18. ИСС открывает возможность построения памяти ИС практические не ограниченной емкости.

Формула 8.

Пример. Компьютерная программа, имитирующая память ИС, построенная на вышеописанных принципах (иерархичность, однородность, N-элементы), на фрактальных текстовых потоках дала монотонно растущий коэффициент компрессии (полное удовлетворение уравнению 8), который превышал значения компрессии для всех известных текстовых архиваторов.

Природа текстов на естественном языке имеет иерархически-фрактальную природу [ ]. Слоги состоят из ограниченного алфавита, слова - из слогов, фразы - из слов, предложения - из фраз, абзацы - из предложений, главы - из абзацев и т.д.

Можно построить фрактальную текстовую последовательность, взяв за основу  какой-либо отрезок естественно языкового текста, в которой сохраняются основные статистические и структурные особенности исходного текста. При этом, даже на ограниченном алфавите текстового отрезка можно построить текстовую последовательность с высокой фрактальной вложенностью, и при ограниченной длине получить основные характеристики, которые были бы получены при обработке текстов всех библиотек мира.

Фрактальные тексты могут имитировать крупномасштабные текстовые потоки естественного языка. Для построения фрактального текста необходим фрагмент какого-либо естественно языкового текста, например, строки или абзаца романа. Затем этот фрагмент надо разделить на К частей (1< К < К0 =100) и полученные отрезки, по два (три-пять) раза в случайном, либо некотором определенном порядке, добавить к исходному фрагмент. В результате длина исходного фрагмента увеличивается в три (четыре-шесть) раза. Далее новый, утроенный (учетверенный-ушестеренный) фрагмент опять делится на К, и затем полученными отрезками его же достраивают. Такая процедура повторяется до тех пор, пока длина полученного фрактального текста не достигнет требуемой длины. С полученной текстовой последовательностью и будут проводиться эксперименты.

Для примера формирования текста по данной методике представим, что мы взяли фрагмент, примерно в две строки реального текста (~ 100 символов). Разбили его на К (К =30), т.е. примерно на "слоги". Составляя "слоги" в дополнение к исходному фрагменту, мы получим псевдо-естественный текст с характеристиками начального фрагмента. Разбивая его опять на К, мы в качестве отрезков уже получим "слова", которыми и достроим наш фрагмент. Потом достроим его псевдо "фразами", "предложениями", "абзацами", "параграфами", "главами", "разделами", "частями", "книгами" и т.д. Все характерные частотные характеристики такого текста сохраняются по отношению к исходному отрезку, а за счет его начальной малости, уже на килобайтных объемах, можно получить результаты, которые бы мы получили на гигабайтных. В результате, на несколько порядков ускоряется проведение эксперимента.

Вывод №19. Эффективность организации памяти ИС с позиции эволюционного потенциала - это характеристика, определяющая скорость эволюционного процесса. Смотри формулу (7).

Вывод №20. Из ПО идет текстовой поток постоянной мощности причинно-связанных цепочек. Причинные связи фактически неограниченной длины. Воспринимая только ограниченной длины цепочки, ИС обрекает себя на существование только в ограниченном ареале ПО. Конструктивное снятие ограничений на емкость памяти ИС открывает ей перспективу неограниченной эволюции.

Пример. В соответствии с формулой (1) ИС получает степенное ускорение, также как и в соответствии с формулой (7) оно еще возрастает в степенной функции, что придает экспансии ИС в ПО устойчивый аттракторный характер.

Вывод №21. Эволюционный потенциал (ЭП, см. формулу 2) характеризует динамику экспансии ИС в ПО. Эволюционный потенциал является основной "валютой" всех ИС и эволюции.

Пример. Скорость экспансии эволюционирующих ИС определяет ИС-лидера. Лидер имеет возможность выбора первым самых привлекательных для него энергетических слов-цепочек. Поэтому в эволюционном процессе основная борьба - это борьба за лидерство в ПО. Те 98-98%% вымерших видов в процессе биологической эволюции на земле просто оказались либо на пути у ИС-лидеров, либо еще не успели набрать запас конструктивной устойчивости к естественным вариациям характеристик ПО.

Вывод №22. В функционировании социальных ИС мы должны пересмотреть существующие критерии социальной значимости действий ИС (людей) в соответствии с утверждением, что эволюционный потенциал является основной целевой функцией всех ИС и их эволюции.

1. Рассматривать эволюционный потенциал своеобразного социального организма под названием ЧЕЛОВЕЧЕСТВО, включающего все различные ИС.

2. Все действия и поступки людей (ИС), которые не увеличивают эволюционный потенциал ЧЕЛОВЕЧЕСТВА, относить к ошибочным, если они были совершены по недостаточному знанию данных ИС о возможности их последствий, и относить к наказуемым (порицаемым), если они были совершены преднамеренно, исходя из эгоистических соображений данных ИС.

3. Все действия и поступки людей, увеличивающие эволюционный потенциал ЧЕЛОВЕЧЕСТВА, оценивать положительно и пропорционально величине прироста эволюционного потенциала, определяемого на основе формулы (2).

Вывод №22?. Немонотонность прироста эволюционного потенциала ИС определяется необходимостью первоначальных затрат на конструирование и ввод в состав ИС новых элементов, что уменьшает эволюционный потенциал, но открывает перспективы по его возможно большему приросту в будущем. Здесь не применим градиентный метод для оптимизации эволюционного процесса ИС в ПО. Чтобы как-то прогнозировать эволюционный процесс в реальной физической ПО, необходимо его как можно достовернее и шире промоделировать на различных вычислительных средах.

Немонотонность прироста эволюционного потенциала объясняет и парадоксы цефализации, когда происходит замена одной элементной или структурной базы ИС на новую, более прогрессивную.

Вывод №23. Память ИС на основе ИСС - это возможность решения задачи пункта 8.5. Это основная задача эволюции ИС, так как не решение ее сводит все предыдущие этапы эволюции  ИС к сизифову безумью.

Заключение

В данном материале были показаны две нелинейности, два аттрактора ПО. Первая – это степенное приращение потенциальных возможностей по выбору высокоэнергетических слов-процессов при линейном росте длины пропускающего их рецепторного окна у устройства ввода ИС.
Вторая –  это при линейном росте ресурса ИС, отводимого под устройство памяти, возможна такая структурная (иерархическая) организация данного устройства памяти, которая будет обеспечивать уже степенной рост отображения в ней текстовых цепочек из ПО.

В эти два аттрактора и эволюционируют ("сваливаются")  в сложноорганизованные образования, которые мы назвали информационными системами (ИС). В III части данной работы будет продолжено выявление и конструктивное использование нелинейностей преобразования в соответствии с (8). Если читателю это покажется интересным, мы его отсылаем к [ ].

 

Литература

  1. Бодякин В.И. Куда идешь, человек? Основы эволюциологии (информационный подход) -М., СИНТЕГ, грант РФФИ, - 332 стр., 1998 г.
  2. Бодякин В.И. "Исследование структурных моделей открытых динамических систем", специальность: 05.13.01 (Управление в технических системах), автореферат диссертации и диссертация на соискание ученой степени  к.ф.-м.н., Москва – 1999 г.
  3. Бодякин В.И. Информационные иерархически-сетевые структуры для представления знаний в информационных системах // сб.тр. Проблемно-ориентированные программы (модели, интерфейс, обучение), М., ИПУ, 1990 г.
  4. Бодякин В.И. "Семантические нейроподобные сети - следующий шаг нейрокомпьютинга" // сб. (круглый стол) "Нейрокомпьютеры 10 лет спустя" МИФИ, 2000г. Bodyakin V. ("Semantic neuroable network - following step of neurocomputing" // Round-table discussion "Neurocomputers 10 years after". 
  5. Бодякин В.И., Петров И.Б. Нейросемантическая парадигма построения информационных систем (Общая теория информационных систем), методический материал для студентов,    МФТИ, 2003г  
  6. Бодякин В.И. Восхождение Разума (футурологическое эссе в трех частях). - М., 2002. - 60с. Издание второе, исправленное и дополненное. 15.02.03. Тираж 150.
  7. Сайт в Интернете   http://www.ipu.ru/stran/bod/bod.htm,  informograd@narod.ru

 

 Для замечаний


© Морозевич Ю. В., Москва, 2008
Hosted by uCoz