- 4.3.4. Особенности обработки данных в субд с сетевой моделью организации данных
- 9. Понятие модели данных. Сетевые модели бд: особенности, преимущества, недостатки.
- 10. Реляционные модели данных: особенности, преимущества, недостатки.
- 11. Постреляционные модели данных: особенности, преимущества, недостатки.
4.3.4. Особенности обработки данных в субд с сетевой моделью организации данных
Основные принципы и способы обработки данных, рассмотренные для реляционных СУБД, также характерны и для немногих сохранившихся, и продолжающих развиваться СУБД с сетевой моделью организации данных.
В сетевых СУБД подобным же образом, как и в реляционных СУБД, реализуются операции поиска, фильтрации и сортировки данных. Распространенность и популярность языка SQLреляционных СУБД привели к тому, чтоподобные языки для реализации запросов к базам данных были разработаны или просто«внедрены» в сетевые СУБД.При этом так же, как и реляционные СУБД, современные сетевые СУБД предоставляют пользователю и специальные диалогово-наглядные средства формирования запросов. Также в сетевые СУБД встраиваются специальные макроязыки для формирования сложных последовательностей взаимосвязанных запросов (аналог процедур), хранящихся вместе с базой данных.
Вместе с тем обработка данных в СУБД с сетевой моделью организации данных, как уже отмечалось, характеризуется уже упоминавшейся принципиальной особенностью, которой нет в реляционных СУБД. Это непосредственная «навигация»по связанным данным (по связанным записям) в разных информационных объектах (аналоги таблиц в реляционных СУБД). Как уже отмечалось, возможность непосредственной навигации обусловлена тем, что в сетевых СУБД ссылки-связи между записями различного типа (различных таблиц) задаются не через внешние ключи, а через специальные указатели на физические адреса расположения связанных записей.
Просматривая, к примеру, в сетевой СУБД записи объекта «Лицо» и выбрав запись «Иванов» (т. е. поместив табличный курсор на соответствующую запись), можно через активизацию поля «Работает» вызвать на экран поля связанной записи в объекте «Организация» и просмотреть соответствующие данные, а далее, при необходимости, через активизацию поля «Адрес» в записи по объекту «Организация» вызвать и просмотреть данные по дислокации места работы сотрудника «Иванов» и т. д. (см. рис. 4.27).
Рис. 4.27. Навигация по связанным записям в сетевых СУБД
В реляционных СУБД для реализации такого просмотра понадобилось бы создать и выполнить запрос на выборку данных из трех таблиц на основе внутреннего (INNER JOIN)соединения при условии отбора соответствующей фамилии сотрудника:
SELECT Лицо.*, Организация.*, Адрес.*
FROM(ЛицоINNERJOIN(АдресINNERJOINОрганизацияONАдрес.№№=Организация.Адрес)
ON(((Лицо.Работает = Организация.Наименование)
WHERE(((Лицo.Фaмилия)=»Ивaнoв»));
При этом, если пользователю необходимо посмотреть те же данные, но для другого сотрудника, то необходимо изменить условия отбора по фамилии и заново выполнить запрос. В сетевых же СУБД для этого достаточно лишь «вернуться» в исходный объект «Лицо», переместить курсор на другую запись и повторить навигацию.
Данный пример показывает, что навигационные возможности сетевых СУБДпозволяют пользователю реализовывать своиинформационные потребности(«беседовать» с базой данных) болееестественным интерактивным способом,шаг за шагом уточняя свои потребности, и тем самым более глубоко и наглядно анализировать (изучать) данные.
Навигационный подход к анализу и просмотру данных, естественный уже для ранних сетевых СУБД, впоследствии (в конце 80-х годов) был реализован в технике гипертекста, и в созданной на его основе новой разновидности документальных информационных систем — гипертекстовых информационно-поисковых систем.
Вместе с тем навигация по связанным данным порождает и ряд своих специфических проблем,таких как «потеря ориентации» и трудности с визуализацией цепочек «пройденных» информационных объектов(записей). Схемы баз данных, отражающих сложные предметные области, могут насчитывать десятки различных информационных объектов и еще большее количество связей между ними. В результате такие базы данных представляют сложное многомерное информационное пространство из множества разнотипных наборов записей, пронизанных и опутанных порой несметным количеством связей. «Путешествуя» в таком клубке, легко «сбиться с пути», потерять общую картину состояния данных.* При этом следует иметь в виду, что особенности человеческого мышления таковы, что человек способен удержать в представлении с полным отслеживанием всех связей и нюансов не более 3-4 сложных объектов.**
* То есть оказаться в ситуации, которая образно выражается известной поговоркой «За деревьями леса не видно».
** Этим, кстати, еще из древности определяется троичная система организации структуры воинских подразделений для эффективного управления ситуацией на поле боя.
Иногда объектом анализа являются не конкретные реквизиты связанных записей, а сама схема связанных записей,т. е. визуализированная цепочка имен связанных от исходного информационного объекта записей. Использованиемножественного типа значений в поляхинформационных объектов сетевых СУБД позволяет реализовывать все типы связей, что приводит к «пучковости» исходящих или входящих связей типа «один-ко-многим», «многие-ко-многим». Визуализация таких цепочек на двумерном экране компьютера может представлять существенные графические сложности.
На рис. 4.28 для примера приведен вариант изображения цепочки связанных записей с корневой записью «Иванов» объекта «Лицо». Такая визуализация позволяет быстро составить общее представление о полученном образовании, трудовой деятельности и проживании данного лица. При этом длина цепочки ограничена тремя последовательно связанными записями, но, как видно из рисунка, и в этом, в общем-то простом для многих жизненных ситуаций случае, достаточно сложно отобразить общую схему связей, не «запутывая» ее восприятие.
Рис. 4.28. Пример визуализации цепочки связанных записей
Навигация по связанным записям в реляционных СУБД открывает новые возможности анализа данных на основе иных, нежели реляционные, семантических принципах. В частности, становится возможным реализация процедур поиска и построения смысловых окрестностей какой-либо записи по ее связям в базе данных, применение различных процедур информационного анализа на основе алгоритмов поиска на графах и т. п.
Одним из направлений развития современной теории и техники СУБД является линия объектно-ориентированных СУБД, которые на витке наработанных в конце 70-х и в 80-х годах решений по реляционным СУБД, обеспечивают новые возможности по обработке данных на основе методов навигации и визуализации, впервые представленных в сетевых СУБД.
9. Понятие модели данных. Сетевые модели бд: особенности, преимущества, недостатки.
Модель данных — это абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абстрактную машину доступа к данным, с которой взаимодействует пользователь. Эти объекты позволяют моделировать структуру данных, а операторы — поведение данных.
Включает в себя три аспекта:
- Аспект культуры (методы описания типов и логических структур данных в базе данных)
- Аспект манипуляции (методы манипулирования данными)
- Аспект целостности (методы описания и поддержки целостности базы данных)
Сетевая модель данных позволяет отображать разнообразные взаимосвязи элементов данных в виде произвольного графа, обобщая тем самым иерархическую модель данных. Сетевая БД состоит из набора записей и набора соответствующих связей. На формирование связи особых ограничений не накладывается. Если в иерархических структурах запись-потомок могла иметь только одну запись-предка, то в сетевой модели данных запись-потомок может иметь произвольное число записей-предков. Преимущества:
- СМД является наиболее полной с точки зрения реализации различных типов связей и ограничений целостности.
Недостатки:
- Является достаточно сложной для проектирования и поддержки.
- Не обеспечивается физическая независимость данных, т.к. наборы организованы с помощью физических ссылок.
- Не обеспечивается независимость данных от программ.
10. Реляционные модели данных: особенности, преимущества, недостатки.
- Структурный аспект — данные в базе данных представляют собой набор отношений.
- Аспект целостности — отношения (таблицы) отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.
- Аспект обработки (манипулирования) — РМД поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).
- Отношение – двухмерная таблица, не содержащая строк-дубликатов
- Сущность есть объект любой природы, данные о котором хранятся в базе данных. Данные о сущности хранятся в отношении
- Запись – строка (ряд, запись, row, кортеж) таблицы
- Отношение – множество кортежей
- Атрибут (столбец). Атрибуты представляют собой свойства, характеризующие сущность. В структуре таблицы каждый атрибут именуется и ему соответствует заголовок некоторого столбца таблицы
- Домен – множество значений атрибута
- Отображает информацию в наиболее простой для пользователя форме
- Отсутствует дублирование информации
- Позволяет создавать языки манипулирования данными не процедурного типа
- Возможно изменение данных
- Медленный доступ к данным
- Трудоемкость разработки
11. Постреляционные модели данных: особенности, преимущества, недостатки.
Классическая реляционная модель предполагает неделимость данных, хранящихся в полях записей таблиц. Это означает, что информация в таблице представляется в первой нормальной форме. Существует ряд случаев, когда это ограничение мешает эффективной реализации приложений. Постреляционная модель данных представляет собой расширенную реляционную модель, снимающую ограничение неделимости данных, хранящихся в записях таблиц. Постреляционная модель данных допускает многозначные поля – поля, значения которых состоят из подзначений. Набор значений многозначных полей считается самостоятельной таблицей, встроенной в основную таблицу. При обработке данных в постреляционной модели не требуется выполнять операцию соединения данных из двух таблиц. SELECT Номер накладной, Номер покупателя, Название товара, Количество товара FROM НАКЛАДНЫЕ; Особенности.
- обеспечивает возможность вложенности полей
- поддерживает ассоциированные многозначные поля (ассоциации)
- На длину полей и количество полей в записях таблицы не накладывается требование постоянства.
- Допускает хранение в таблицах ненормализованных данных.
Достоинством постреляционной модели является возможность представления совокупности связанных реляционных таблиц одной постреляционной таблицей. Это обеспечивает высокую наглядность представления информации и повышение эффективности ее обработки. Недостатком постреляционной модели является сложность решения проблемы обеспечения целостности и непротиворечивости хранимых данных.