Структуры данных СУБД, общий подход к организации представлений, таблиц, индексов
Сущностью (entity) называется отдельный тип объекта организации (человек, место или вещь, понятие или событие), который надо представить в базе данных.
Атрибутом (attribute) называется свойство, которое описывает некоторую характеристику описываемого объекта. Связь (relationship) – это то, что объединяет несколько сущностей.
Структуры данных СУБД, общий подход к организации представлений, таблиц, индексов
два варианта обновления данных в хранилище:
Полное обновление данных в хранилище. Сначала старые данные удаляются, потом происходит загрузка новых данных. Процесс происходит с определённой периодичностью, при этом актуальность данных может несколько отставать от OLTP-системы.
Инкрементальное обновление — обновляются только те данные, которые изменились в OLTP-системе.
Структуры данных СУБД, общий подход к организации представлений, таблиц, индексов
Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.
Интегрированность. Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса.
Некорректируемость. Данные в хранилище данных не создаются: т.е. поступают из внешних источников, не корректируются и не удаляются.
Зависимость от времени. Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени.
Структуры данных СУБД, общий подход к организации представлений, таблиц, индексов
два архитектурных направления:
нормализованные хранилища данных
хранилища с измерениями.
Структуры данных СУБД, общий подход к организации представлений, таблиц, индексов
Операции с данными:
Извлечение – перемещение информации от источников данных в отдельную БД, приведение их к единому формату.
Преобразование – подготовка информации к хранению в оптимальной форме для реализации запроса, необходимого для принятия решений.
Загрузка – помещение данных в хранилище, производится атомарно, путем добавления новых фактов или корректировкой существующих.
Анализ – OLAP, Data Mining, сводные отчёты.
Представление результатов анализа.
Вся эта информация используется в словаре метаданных.
© ООО «Знанио»
С вами с 2009 года.