Реферат: Лекции по теории проектирования баз данных (БД)

Лекция1Технологияпроектирования баз данных

Вопросы:

Теоретические основы проектирования БД;

Проектирование базыданных как элемент информационной технологии

Как видно из материалов предыдущих лекций основубольшинства информационных технологий составляют большие массивы накопленнойинформации. Основной формой организации хранения данных в информационныхсистемах являются базы данных. В курсе “Автоматизированные системы обработкиучетной информации” мы рассмотрели основные понятия, связанные с моделямиданных, теоретические основы разработки простейших баз данных и жизненный циклбаз данных. Теперь, рассматривая БД как часть информационной технологии,необходимо по новому взглянуть на проблему проектирования базы.

Проблемы проектирования связаны с функциями БД впрограммно — технологической среде, поддерживающей информационные технологии. Вобщем случае место БД можно отразить следующей схемой:

База

данных

Операционная система

Аппаратная

среда

информационных

технологий

Прочие

приложения

Поскольку база данных является связующим звеноммежду пользовательскими приложениями и аппаратными средствами, еепроектирование можно разделить на два направления: проектирование структуры ипользовательских приложений и распределение данных по аппаратным средствам (вслучае баз данных на сетях). В данном разделе мы рассмотрим вопросыпроектирования структуры базы данных. В дисциплине АСОЭИ, рассматривая основыреляционной алгебры и разработки реляционных моделей, мы коснулись вопросовпроектирования реляционных баз данных. Одной из распространенных технологийразработки БД является следующая:

В результате получается модель реляционной базыданных, которая представляет собой совокупность взаимосвязанных отношений.

Построение сетевой модели связано скорее спотребностью разработчика графически представить взаимосвязь данных, полученныхв результате интеграции представлений пользователей. Преобразование сетевоймодели в реляционную дает первую нормальную форму последней. Напомним, чтоотношение R находится в первой нормальной форме, если значения в dom(A) являютсяатомарными для каждого атрибута А в R. Вторая и третья нормальные формыпозволяют избежать аномалий при обновлении данных и избавится от информационнойизбыточности в отношениях. Напомним, что отношение R нормальной форме, если ононаходится в первой нормальной форме и каждый атрибут не являющийся ключом полностьюзависит от любого ключа в R. И отношение R находится в третьей нормальнойформе, если оно находится во 2НФ и каждый атрибут, не являющийся первичнымключом не транзитивно зависит от любого возможного ключа.

Недостатком такого подхода является то, что вмоделях, имеющих десятки и сотни атрибутов очень трудно имперически построитьмодель, все отношения которой заданы в третьей нормальной форме и связаны междусобой таким образом, что составляют единое целое.

Пример.

А В С

D F G H

G V M N

B M T X

Другим подходом является возможность формальногосинтеза модели на основании априорно установленных зависимостей междуатрибутами. Зависимости между атрибутами устанавливаются на основании смысловойсвязи.

Пример.

НОМЕР_ЗАЧЕТКИ — ИМЯ_СТУДЕНТА

НОМЕР_РЕЙСА — ДАТА_ВЫЛЕТА

Безусловно такой подход к разработке модели базыданных предпочтительнее, так как позволяет автоматизировать процессмоделирования. Для реализации этого подхода необходимо расширение теоретическойбазы, полученной в курсе АСОЭИ.

Теоретическиеосновы проектирования БД.

Основные понятия.

Поскольку рассматриваемый подход к разработкереляционной модели базируется на формальной логике, то в его основе должнылежать некоторые фундаментальные формализации. В теории реляционных баз данныхк ним относятся понятия атрибута, отношения, ключа и функциональной зависимости.

Атрибутом будем называть поименованное свойствообъекта и обозначать Аi, где <img src="/cache/referats/13059/image018.gif" v:shapes="_x0000_i1025">i обозначим dom(Аi).Тогда отношением R называется конечное множество атрибутов <img src="/cache/referats/13059/image020.gif" v:shapes="_x0000_i1026"><img src="/cache/referats/13059/image022.gif" v:shapes="_x0000_i1027"> со следующим свойством.Для любых двух различных кортежей t1 и t2 в R существуеттакое <img src="/cache/referats/13059/image024.gif" v:shapes="_x0000_i1028">1(B)<img src="/cache/referats/13059/image026.gif" v:shapes="_x0000_i1029">2(B). Другими словами, не существует двухкортежей, имеющих одно и то же значение на всех атрибутах из К. Таким образом,достаточно знать К — значение кортежа, чтобы идентифицировать кортеж однозначно.

Пример.

СТУДЕНТ[НОМЕР_ЗАЧЕТКИ, ИМЯ, КУРС, ГРУППА]

Ключи, явно указанные в модели называютсявыделенными. Могут быть ключи отличные от выделенных и называемые неявнымиключами. Например ИМЯ в предыдущем прмере.

Под функциональной зависимостью атрибутов илиF-зависимостью понимают такую связь между атрибутами, когда значения кортежа наодном множестве атрибутов единственным образом определяют эти значения надругом множестве атрибутов. Так в отношении:

ГРАФИК[ПИЛОТ, РЕЙС, ДАТА, ВРЕМЯ]

ПИЛОТ функционально зависит от {РЕЙС, ДАТА}

F-зависимости принято обозначать {РЕЙС, ДАТА}->ПИЛОТ и говорят, что РЕЙС и ДАТА функционально определяют ПИЛОТ.

В терминах теории множеств и реляционной алгебрыF-зависимость определяется так. Пусть R отношение и X, Y подмножества атрибутовв R. Отношение R удовлетворяет функциональной зависимости X -> Y, если p

Y(sX-x®)имеет не более чем один кортеж для каждого Х — значения х. В F-зависимостиX->Y подмножество X называется левой частью, а Y — правой частью. Лекция2

Такая интерпретация функциональной зависимостиявляется основой алгоритма SATISFIES, приводимого ниже.

SATISFIES

Вход: Отншение R и F-зависимость X->Y.

Выход: истина, если R удовлетворяет X->Y, ложь — в противном случае.

SATISFIES(R,X->Y)

Этот алгоритм проверяет, удовлетворяет ли отношение RF-зависимости X -> Y.

Пример.

В результате выполнения алгоритма SATISFIES выяснимудовлетворяет ли F-зависимость РЕЙС -> ВРЕМЯ_ВЫЛЕТА следующему отношению

ГРАФИК

ПИЛОТ

РЕЙС

ДАТА

ВРЕМЯ_ВЫЛЕТА

А...

9 авг