Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Хранилища и витрины данных.






К данному типу относят хранилища и витрины данных, инструменты аналитической обработки, средства обнаружения знаний, а также средства формирования запросов и построения отчетов.

Хранилища данных определятся как «предметно-ориентированные, интегрированные, стабильные, поддерживающие хронологию наборы данных, призванные выступать в роли “единого и единственного источника истины”, обеспечивающего пользователей достоверной информацией, необходимой для анализа и принятия решений». Ценность хранилищ данных заключается в том, что они представляют собой крупные базы данных, которые содержат определенную информацию и обеспечивают ее оперативное представление в виде, удобном для пользователя или для дальнейшей обработки аналитическими системами, экспертными и документальными системами.

Витрины данных (Data Marts), как и хранилища, представляют собой структурированные информационные массивы, но их отличие состоит в том, что они в еще большей степени являются предметно-ориентированными. Как правило, витрина содержит информацию, относящуюся к какому-либо определенному предметному направлению. Поэтому информация в витринах данных хранится в специальном виде, наиболее подходящем для решения конкретных аналитических задач или обработки запросов определенной группы аналитиков.

Есть два взгляда на витрины данных. В одном случае витрина, по сути дела, представляет собой часть хранилища, оптимизированную для запросов к данным конкретной предметной области, в том числе для передачи этих данных для последующей обработки в другие аналитические системы. Поэтому с точки зрения организации хранения данных витрины могут быть как реляционными, так и многомерными, однако в любом случае они обладают таким общим свойством, как предметная ориентированность.

Еще одним элементом, который часто выделяют в отдельную категорию, являются средства обнаружения знаний (Data Mining). Соответствующие программные продукты позволяют выявлять закономерности в данных и на этой основе получать качественно новую информацию. Такая информация, возможно, не содержится в источнике данных явным образом, поэтому в данном случае происходит формирование знаний на основе данных. Г.Пиатецкий-Шапиро (Gregory PiatetskyShapiro), один из ведущих экспертов в данной области, определяет деятельность таких систем как «процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности». В деятельности систем обнаружения знаний используются такие методы анализа данных, как фильтрация, дерево решений, ассоциативные правила, генетические алгоритмы, нейронные сети, статистический анализ.

Наконец, к числу подобных систем относятся средства формирования запросов и построения отчетов (Query and Reporting tools). Такие системы обеспечивают построение запросов к информационно-аналитическим системам в пользовательских терминах, с возможной интеграцией данных из разных источников, а также просмотр информации с возможностью ее детализации и агрегирования, построение отчетов и их печать. Такие системы могут использоваться пользователями, обладающими «продвинутыми» техническими навыками. Профессиональных знаний в области информационных технологий при этом не требуется, однако для специалистов такие средства не всегда бывают удобны. Как правило, модули, содержащие функции формирования запросов и построения отчетов, входят в состав многих информационных систем, хотя есть и отдельные программные продукты этого класса.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.