Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






OLAP – технологии и хранилища данных






В основе концепции OLAP лежит принцип многомерного представления данных. В 1993 г. Е. Ф. Кодд рассмотрел недостатке реляционной модели, в первую очередь указав на невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений, т. е. самым понятным для корпоративных аналитиков способом», и определил общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик.

Аббревиатурой OLAP иногда обозначается не только много­мерный взгляд на данные, но и хранение самих данных в много­мерной БД. Однако Кодд отмечал, что «...реляционные БД были, есть и будут наиболее подходящей технологией для хране­ния корпоративных данных. Необходимость существует не в но­вой технологии БД, а, скорее, в средствах анализа, дополняю­щих функции существующих СУБД и достаточно гибких, чтобы предусмотреть и автоматизировать разные виды интеллектуаль­ного анализа, присущие OLAP».

Для выполнения аналитических запросов могут быть исполь­зованы приложения, написанные специально для решения тех или иных практических задач. При этом для решения задач ана­литической обработки используются данные, характер и органи­зация которых несколько отличается от того, как это принято в системах, ориентированных на оперативную обработку.

Использование концепции хранилища данных (ХД) позволяет обеспечить:

• своевременное обеспечение аналитиков всей информаци­ей, необходимой для выработки решений;

• создание единой модели данных организации;

• создание интегрированного источника данных, предостав­ляющего удобный доступ к разнородной информации из различных подсистем (единый источник).

Для хранилищ данных характерны следующие основные свойства:

• ориентация на предметную область — хранилище в первую очередь отражает специфику предметной области, а не приложений;

• интегрированность — информация, загружаемая в хранилище из баз, ориентированных на частные прикладные задачи, должна быть приведена к единому синтаксическое семантическому виду. Важно также провести проверку И ступающих данных на целостность и непротиворечиво Чтобы при выполнении аналитических запросов избеэк выполнения операций группирования, данные должны обобщаться (агрегироваться) при загрузке хранилища;

• неизменяемость данных — хранилищам свойственна ретп спективность: объем накопленных данных должен бьт достаточным для решения аналитических задач с требур мым качеством. Поэтому важное отличие аналитических систем от систем операционной обработки состоит в том что данные после загрузки в них остаются неизменными внесение каких-либо изменений, кроме добавления запи­сей, не предполагается;

• поддержка хронологии — для выполнения большинства ана­литических запросов необходим анализ тенденций разви­тия явлений или характера изменения значений переменных во времени, что обычно достигается введением атрибу­тов типа дата/время;

• многомерное концептуальное представление (multi-dimen­sional conceptual view) — множественная перспектива, со­стоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные сово­купности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каж­дое измерение включает направления консолидации дан­ных, состоящие из серии последовательных уровней обоб­щения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнитель может определиться направлением консолидации, состоящим из уровней обобщения предприятие—подразделение—отдел—служащий. Измерение Время может даже включать два направления консолидации — год—квартал—месяц—день и неделя—день, поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможны произвольный выбор желаемого уровня детализации и формации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступен консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к выс­шим (рис 5.18).

Кода определил 12 свойств, которыми должны обладать сис­темы этого класса (табл. 5.6).






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.