Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Oltp и OLAP системы
Электронная аналитическая обработка (OLAP) баз данных упрощает обработку запросов бизнес-аналитики. OLAP — это технология организации баз данных, оптимизированная для обработки запросов и получения отчетов, вместо обработки транзакций. Источником данных для OLAP являются базы данных систем оперативной обработка транзакций (OLTP), обычно размещенные в хранилищах данных. Данные OLAP выводятся из этих данных за длительный период времени и объединяются в структуры, дающие возможность сложного анализа. Данные OLAP организуются иерархически и хранятся в кубах вместо таблиц. Это сложная технология, использующая многомерные структуры для обеспечения быстрого доступа к данным для анализа. Такая организация позволяет легко создавать отчеты сводных таблиц и сводных диаграмм для отображения высокоуровневых сводок, таких как совокупность продаж по всей стране, а также отображать подробности для мест, где продажи чрезвычайно велики или малы. Базы данных OLAP предназначены для ускорения поиска данных. Поскольку сервер OLAP, в отличие от Microsoft Office Excel, вычисляет итоговые значения, требуется меньше данных для пересылки в Excel при создании или изменении отчета. Такой подход дает возможность работать с гораздо большим объемом исходных данных, нежели когда данные организованы как традиционная база данных, в которой Excel отыскивает все отдельные записи и затем вычисляет итоговые значения. Базы данных OLAP содержат два основных типа данных: показатели, являющиеся числовыми данными, количества и средние значения, используемые для для разработки обоснованных деловых решений, и размерности, являющиеся категориями, используемыми для организации этих показателей. Базы данных OLAP помогают организовать данные по многим уровням детализации, используя знакомые категории для анализа данных. В следующих разделах подробнее описан каждый из этих компонентов. Куб. Структура данных, объединяющая показатели по уровням и иерархиям для каждой размерности, которую нужно проанализировать. Кубы объединяют несколько размерностей, таких как время, география и ассортимент изделий, с суммарными данными, такими как продажи и суммы запасов. Кубы не являются «кубами» в строго математическом смысле, поскольку их стороны не обязательно равны. Это удобная метафора для сложного понятия. Показатели. Набор значений в кубе, основанных на столбце фактической таблицы в кубе, обычно являющийся числовыми значениями. Показатели — это основные значения в кубе, которые предварительно обрабатываются, группируются и анализируются. Обычные примеры: продажи, прибыль, выручка и затраты. Элемент. Элемент в иерархии, представляющий один или несколько экземпляров данных. Элемент может быть уникальным или не уникальным. Например, годы 2007 и 2008 представляют собой уникальные элементы на уровне года размерности времени, в то время как январь представляет собой не уникальные элементы на уровне месяца, так как в размерности времени может быть больше одного января, если в ней содержатся данные за несколько лет. Вычисляемый компонент. Элемент размерности, значение которого вычисляется во время работы с помощью выражения. Вычисляемые значения компонентов могут выводиться из значений других элементов. Например, вычисляемый компонент «Прибыль» может определяться вычитанием значения элемента «Затраты» из значения элемента «Продажи». Размерность. Набор из одного или нескольких организованных иерархий уровней в кубе, понятный пользователю и используемый им в качестве основы для анализа данных. Например, географическая размерность может включать уровни для страны, области и города. Или размерность времени может включать иерархию с уровнями для года, квартала, месяца и дня. В отчетах сводной таблицы или сводной диаграммы каждая иерархия становится набором полей, который пользователь может развернуть или свернуть, чтобы показывать более низкие или более высокие уровни. Иерархия. Структура логического дерева, организующая элементы размерности таким образом, что каждый элемент имеет один родительский элемент и нуль или более дочерних элементов. Дочерний элемент — это элемент на следующем более низком уровне в иерархии, непосредственно связанный с текущим элементом. Например, в иерархии «Время», содержащей уровни «Квартал», «Месяц» и «День», «Январь» является дочерним элементом члена «Кв1». Родительский элемент — это элемент на следующем более высоком уровне в иерархии, непосредственно связанный с текущим элементом. Родительское значение обычно является объединением значений всех его дочерних элементов. Например, в иерархии «Время», содержащей уровни «Квартал», «Месяц» и «День», «Кв1» является родительским элементом элемента «Январь». Уровень. Внутри иерархии данные могут быть организованы по более низким и более высоким уровням детализации, таким как уровни года, квартала, месяца и дня в иерархии «Время». Сокращенно и удобно:
|