Корректный выбор признаков разложения задачи

© В.И. Бодякин

Одна из актуальнейших проблем информатики - проблема адекватности отображения ограниченной нейронной сетью (графом) реальных процессов. Любую задачу можно представить как множество различных разбиений на ее элементы. При этом возникает вопрос о большей или меньшей корректности того или иного разбиения, а соответственно и об общем критерии корректности.

Неполнота данных - обычное состояние любой исследуемой области. Извлечение знаний из информационных потоков - "data mining", новая, бурно развиваемая область науки, нацеленная на автоматизацию обработки огромных потоков в глобальных сетях и больших базах данных.

Характерная черта всех задач - их открытость или незамкнутость (с которой всячески пытаются бороться разработчики). Другая особенность - это неограниченность во времени найденных решений (если это не субъективно-конъюктурные решения).

Все естественные задачи являются частным случаем самой общей задачи - эволюции Вселенной. Для Вселенной характерно преобладание более чем в 10100 раз количества ее состояний над числом составляющих ее элементов (элементарных частиц). Это условие сразу выдвигает критерий минимизации материального ресурса при отображении задачи.

Под ресурсом будем понимать объективную сущность, имеющую определенные свойства, количественную меру и допускающую точные измерения.

Представим материальный ресурс (R) в виде произвольного функционала, допустим, как произведения трех величин:

R = F ( V * T * M )

где - V-пространство, M-число элементов и T-время

В нашем случае под материальным ресурсом можно рассматривать количество вершин графа R = F(M), отображающего задачу. Для нахождения решения необходимо располагать предметноориентированной информацией. Сам процесс познания - это установление изоморфизма между структурой причинно-следственных отношений информационного потока внешней среды (предметной области) с внутренней образной структурой нейросетевой моделью этих же процессов. Так познанные законы объективного мира становятся законами функционирования мышления.

Основная "горячая точка" сегодняшней автоматизации информационных процессов - это практическое решение крупномасштабных задач в слабоструктурированных предметных областях.

Под крупномасштабными ИС мы будем рассматривать ИС, оперирующие ресурсами, как минимум на 5-10 порядков больше, чем "учебные примеры" из курсов вычислительной техники. В качестве слабоструктурированных предметных областей будем рассматривать предметные области с реальным потоком данных без какой-либо предварительной их обработки.

Из вышеизложенного следует, что для решения задач из незамкнутых крупномасштабных слабоструктурированных предметных областей необходимо иметь информационные системы (ИС) с нелинейно положительными преобразованиями потока данных в структуру состояний ИС, т.е. при постоянном потоке (I(t)) информации ИС должна затрачивать все меньше и меньше ресурса (R) для отображения этого потока в своей структуре (критерий корректности структуризации). Аналитически эта формулировка выглядит следующим образом:

dRис/dt ® 0 при I(t) = const и t ® Ґ

dRис/dt ® 0 - необходимый параметр любых ИС, претендующих на работу с крупномасштабными предметными областями.

Это утверждение можно переформулировать следующим образом: если при постоянном потоке предметноориентированной информации прирост количества новых вершин взвешенного графа монотонно уменьшается, то выбор признаков разложения задачи был произведен корректно, иначе нет.

 

назад    на уровень вверх    вперед

Вернуться на главную

Hosted by uCoz