СИСТЕМА АРХИВАЦИИ
СВЕРХБОЛЬШИХ ОБЪЕМОВ ДАННЫХ
(СВЕРХБОЛЬШИХ АРХИВОВ)
Предлагаемая к разработке система архивации ориентирована на большие и сверхбольшие объемы данных, предпочтительно архивного характера.
Особенностью этой системы является большая степень компрессии данных, которая существенно зависит как от их характера (энтропийной меры), так и от объема (!). В отличии от большинства используемых архиваторов, предлагаемая система архивации имеет неограниченный коэффициент компрессии, который монотонно растет с объемом архивируемых данных.
Другая особенность, являющаяся уже негативной характеристикой, это относительно большое время, необходимое для архивации, примерно с такой же тенденцией как и у фрактальных алгоритмов сжатия (чемпионов по коэффициенту сжатия), но лучше их на несколько порядков.
Если областью применения фрактальных алгоритмов являются графические данные, то предлагаемый метод архивации ориентирован на текстовые данные, поэтому симбиоз этих двух методов архивации мог стать абсолютным чемпионом по компрессии для любого типа информации (или же стандартных тестовых файлов). Хотя следует отметить, что существуют программы преобразования в текстовую форму графической и вообще любых форм информации. Соответственно и "абсолютный чемпион по компрессии" может быть полностью построен на предлагаемой системе, что существенно улучшит характеристики "абсолютного чемпиона".
Несколько слов о предлагаемой системы архивации. Это система иерархических словарей. Вся исходная архивируемая тестовая последовательность преобразуется в структуру иерархических словарей. Одни из механизмов их формирования представлен в работе [1].
Разработка предлагаемой системы архивации сверхбольших объемов данных может осуществляться как в рамках совместной работы, так и в форме гранта.
Для желающих более подробно ознакомиться с бизнес-планом системы архивации E-mail: BODY@IPU.RSSI.RU
г Группа Информоград 2001