Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Контрольная работа'
Настоящее положение разработано на основе приложения к письму Минобразования России от 30.12.99 № 16-52-290ин/16-13 «Рекомендации по организации учеб...полностью>>
'Документ'
4 5. Судебное разбирательство. 4 . Психологические основы регулирования межличностных отношений в деятельности секретаря мирового судьи....полностью>>
'Документ'
Савчук В.С. - председатель оргкомитета - член-кореспондент НАН Украины, д.э.н., проф., проректор по научной работе Киевского национального экономичес...полностью>>
'Доклад'
«Особенности формирования структуры и свойств порошковых Fe-P-C, Fe-Mn-C, Fe-B, Fe-B-C материалов полученных горячей штамповкой в присутствии жидкой ...полностью>>

Главная > Документ

Сохрани ссылку в одной из сетей:

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение
высшего профессионального образования

Московский государственный институт электроники и математики

(Технический университет)

И.П. Карпова

БАЗЫ ДАННЫХ

Утверждено Редакционно-издательским советом института

в качестве Учебного пособия

Москва 2009

УДК 004.65

ББК 32.973

К26

Рецензенты: докт. техн. наук И.П. Беляев (НИИ ИТ)

канд. физ.-мат. наук Ю.А. Семёнов (МФТИ)

Карпова И.П.

К26 Базы данных. Учебное пособие. – Московский государственный институт электроники и математики (Технический университет). – М., 2009. – 118 с.

Рассматриваются основные модели данных, технологии организации баз данных и методы проектирования баз данных.

Для студентов дневных и вечерних факультетов технических вузов, изучающих автоматизированные информационные системы и системы управления базами данных.

УДК 004.65

ББК 32.973

ISBN  Карпова И.П., 2009

Оглавление

1.1.Информация, данные, знания. Терминология 6

1.2.Автоматизированная информационная система 7

1.3.Предметная область информационной системы 9

1.4.Назначение и основные компоненты системы баз данных 12

1.5.Уровни представления данных 13

2.ОСНОВНЫЕ МОДЕЛИ ДАННЫХ 16

2.1.Понятие модели данных 16

2.2.Сетевая модель данных (СМД) 20

2.3.Иерархическая модель данных (ИМД) 22

2.4.Реляционная модель данных (РМД) 25

2.5.Другие модели данных 32

3.СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ 34

3.1.Классификация СУБД 34

3.2.Правила Кодда для реляционной СУБД (РСУБД) 35

3.3.Основные функции реляционной СУБД 37

3.4.Администрирование базы данных 38

3.5.Словарь-справочник данных 38

4.ФИЗИЧЕСКАЯ ОРГАНИЗАЦИЯ ДАННЫХ 40

4.1.Механизмы среды хранения и архитектура СУБД 40

4.2.Структура хранимых данных 41

4.3.Управление пространством памяти и размещением данных 42

4.4.Виды адресации хранимых записей 44

4.5.Способы размещения данных и доступа к данным в РБД 46

5.МНОГОПОЛЬЗОВАТЕЛЬСКИЙ ДОСТУП К ДАННЫМ 60

5.1.Механизм транзакций 60

5.2.Взаимовлияние транзакций 63

5.3.Уровни изоляции транзакций 65

5.5.Временные отметки 68

6.ЗАЩИТА ДАННЫХ В БАЗАХ ДАННЫХ 70

6.1.Обеспечение целостности данных 70

6.2.Обеспечение безопасности данных 71

6.3.Защита от несанкционированного доступа 74

7.ОПТИМИЗАЦИЯ РЕЛЯЦИОННЫХ ЗАПРОСОВ 78

7.1.Этапы оптимизации запросов в реляционных СУБД 78

7.2.Преобразования операций реляционной алгебры 80

7.3.Методы оптимизации 82

7.4.Настройка приложений 87

8.ЭЛЕМЕНТЫ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ 91

8.1.Требования к проекту базы данных 91

8.2.Этапы проектирования базы данных 92

8.3.Инфологическое проектирование 97

8.3.1.Метод "сущность-связь" 98

8.3.2.Объединение локальных представлений 100

8.4.Определение требований к операционной обстановке 101

8.5.Выбор СУБД и инструментальных программных средств 102

8.6.Логическое проектирование БД 102

8.7.Физическое проектирование БД 103

8.8.Автоматизация проектирования БД 103

8.9.Особенности проектирования реляционных БД 104

9.ПЕРСПЕКТИВЫ РАЗВИТИЯ ТЕХНОЛОГИИ БАЗ ДАННЫХ 117

Предметный указатель 120

Список используемых сокращений 124

Библиографический список 124

"Цивилизация развивается за счёт расширения числа важных операций, которые можно выполнять, не думая о них".
Альфред Норт Уайтхед, британский математик, логик, философ

  1. ВВЕДЕНИЕ

Развитие средств вычислительной техники и информационных технологий обеспечило возможности для создания и широкого применения автоматизированных информационных систем (АИС) разнообразного назначения. Разрабатываются и внедряются информационные системы управления хозяйственными и техническими объектами, модельные комплексы для научных исследований, системы автоматизации проектирования и производства, всевозможные тренажеры и обучающие системы.

Различают АИС, основанные на знаниях, и АИС, основанные на данных. К первым можно отнести, например, экспертные системы (ЭС), интеллектуальные системы поддержки принятия решений (СППР) и т.п. Ко вторым – всевозможные прикладные системы, которые сейчас активно используются и на предприятиях, и в учреждениях. Такие прикладные системы применяются очень широко, и в рамках данного курса наше внимание будет сосредоточено именно на системах, которые основаны на данных.

Существуют две основные предпосылки создания таких систем:

  1. Разработка методов конструирования и эксплуатации систем, предназначенных для коллективного использования.

  2. Возможность собирать, хранить и обрабатывать большое количество данных о реальных объектах и явлениях, то есть оснащение этих систем "памятью".

Массив данных общего пользования в системах, основанных на данных, называется базой данных. База данных (БД) является моделью предметной области информационной системы.

На заре развития вычислительной техники обрабатываемые данные являлись частью программ: они располагались сразу за кодом программы в так называемом сегменте данных (рис. 1.1,а). Следующим шагом стало хранение данных в отдельных файлах (рис. 1.1,б). Недостатком этих двух подходов являлась зависимость программ от данных: сведения о структуре данных включались в код программы. При изменении структуры данных необходимо было вносить изменения в программу.

Рис.1.1. Развитие принципов обработки данных

Логичным продолжением этой эволюции является перенос описания данных в массив данных (рис. 1.1,в). Это позволило обеспечить независимость данных от программ.

Основным принципом организации баз данных является совместное хранение данных и их описания.

Описание данных называют метаданными. Метаданные хранятся в части базы данных, которая называется каталогом или словарём-справочником данных (ССД). Зная формат метаданных, можно запрашивать и изменять данные без написания дополнительных программ.

Одна и та же база данных может быть использована для решения многих прикладных задач. Наличие метаданных и возможность информационной поддержки решения многих задач – это принципиальные отличия базы данных от любой другой совокупности данных, расположенных во внешней памяти ЭВМ.

    1. Информация, данные, знания. Терминология

Информация – любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, например, находящаяся в памяти ЭВМ или подготовленная для ввода в ЭВМ.

Подготовка информации состоит в её формализации, сборе и переносе на машинные носители.

Обработка данных – это совокупность задач, осуществляющих преобразование массивов данных. Обработка данных включает в себя ввод данных в ЭВМ, отбор данных по каким-либо критериям, преобразование структуры данных, перемещение данных на внешней памяти ЭВМ, вывод данных, являющихся результатом решения задач, в табличном или в каком-либо ином удобном для пользователя виде.

Система обработки данных (СОД) – это набор аппаратных и программных средств, осуществляющих выполнение задач по управлению данными.

Управление данными – совокупность функций обеспечения требуемого представления данных, их накопления и хранения, обновления, удаления, поиска по заданному критерию и выдачи данных. [6]

Предметная область (ПО) – часть реального мира, подлежащая изучению с целью организации управления и, в конечном итоге, автоматизации.

База данных (БД) – совокупность данных, организованных по определённым правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ [6]. Эти данные относятся к определённой предметной области и организованы таким образом, что могут быть использованы для решения многих задач многими пользователями.

Ведение базы данных – деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения её целостности, сохранности и эффективности использования [6].

Система управления базами данных (СУБД) – это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия её с прикладными программами [6].

Автоматизированная информационная система (АИС) представляет собой совокупность данных, экономико-математических методов и моделей, технических, программных средств и специалистов, предназначенную для обработки информации и принятия управленческих решений.

Банк данных (БнД) – это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (математических, информационных, программных, языковых, организационных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей. Банк данных должен:

  1. Обеспечивать информационные потребности внешних пользователей.

  2. Обеспечивать возможность хранения и модификации больших объёмов многоаспектных данных.

  3. Обеспечивать заданный уровень достоверности хранимых данных и их непротиворечивость.

  4. Обеспечивать доступ к данным только пользователям с соответствующими полномочиями.

  5. Обеспечивать поиск данных по произвольной группе признаков.

  6. Удовлетворять заданным требованиям по производительности при обработке запросов.

  7. Иметь возможность реорганизации при изменении границ ПО.

  8. Обеспечивать выдачу пользователям данных в различной форме.

  9. Обеспечивать простоту и удобство обращения внешних пользователей к данным.

    1. Автоматизированная информационная система

Под автоматизированной информационной системой (АИС) будем понимать совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации.

АИС, основанная на базе данных, служит для сбора, накопления, хранения информации, а также её эффективного использования для различных целей. Информация представляется в виде данных, хранимых в памяти ЭВМ. При проектировании АИС, с одной стороны, решается вопрос о том, какие сведения и для каких целей будут содержаться в системе, с другой – как соответствующие данные будут организованы в памяти ЭВМ и как они будут обрабатываться при эксплуатации АИС.

По сферам применения и правилам организации различают два основных класса АИС, основанных на базе данных: информационно-поисковые (ИПС) и системы обработки данных (СОД). ИПС ориентированы, как правило, на извлечение подмножества хранимых данных, удовлетворяющих некоторому поисковому критерию. Пользователя ИПС интересуют, в основном, сами извлекаемые из базы данных сведения, а не результаты их обработки. Примером ИПС является любая справочная служба: к ней обращаются с запросом и получают в результате те данные, которые удовлетворяют этому запросу.

Обращения пользователя к СОД чаще всего приводят к обновлению данных. Вывод данных может вовсе отсутствовать или представлять собой результат программной обработки хранимых сведений. Пример СОД – банковские системы, осуществляющие открытие/закрытие счетов, пересчёт вкладов в зависимости от процентов, приём/снятие сумм и т.п.

В зависимости от характера информационных ресурсов, с которыми имеют дело АИС, их подразделяют на документальные и фактографические системы. На практике используются также системы комбинированного типа.

Фактографические АИС хранят сведения об объектах предметной области, их свойствах и взаимосвязях. Сведения о каждом объекте могут поступать в систему из множества различных источников. Кроме поиска и модификации данных, фактографические системы поддерживают статистические функции (нахождение суммы, минимума, максимума и т.п.). Фактографические АИС обычно принадлежат к классу систем обработки данных.

В документальной системе объект хранения – документ, который содержит информацию, относящуюся к определённой предметной области. Это могут быть графические изображения (например, географические карты); информация на естественном языке (монографии, тексты законодательных актов, научные отчёты и т.п.); звуковая информация (например, мелодии для системы, хранящей фонотеку) и т.д. Для обработки данных не важно, какие сведения хранятся в документах. Обычно (но не всегда) документальные АИС реализуются в виде информационно-поисковых систем (ИПС).

Основные компоненты документальной ИПС:

  • программные средства;

  • поисковый массив документов;

  • средства поддержки информационного языка системы.

Программные средства ИПС служат для организации управления данными (ввода, хранения, защиты, поиска и выдачи). Поисковый массив документов в ИПС обычно называется базой данных. Он представляет собой набор ссылок на документы (или их описаний), хранящий основную информацию о документах и организованный так, чтобы обеспечить быстрый поиск документов. Описание документа зависит от предметной области и состоит из значений атрибутов, характеризующих содержание документа. Например, для БД географических карт это могут быть координаты и масштаб, а для БД законодательных актов – тип документа (закон, постановление и др.), дата принятия, область действия и т.п.

Информационный язык ИПС предназначен для того, чтобы пользователь мог запросить данные у системы. Системными средствами пользовательский запрос преобразуется в формальный запрос, понятный системе. Информационный язык ИПС может быть основан на подмножестве естественного языка, которое относится к обслуживаемой ПО. Но чаще поиск документа осуществляется с помощью шаблонов – экранных форм, включающих поля описания документа. В эти поля вносятся конкретные значения, которые и определяют условия поиска документов. На рис. 1.2 приведён пример поиска через экранную форму в справочнике библиотек. В форме указаны два условия – округ и фрагмент названия библиотеки, и в результате поиска система выдала три записи, удовлетворяющие этим условиям.

Рис.1.2. Пример поиска данных через экранную форму

Мы будем основное внимание уделять фактографическим АИС, имея в виду, что ИПС и документальные АИС создаются с помощью тех же программных средств и на тех же принципах, что и СОД, а специфические моменты обработки данных реализуются через приложения (программы, внешние по отношению к ядру СОД).

Разработка любой АИС начинается с определения предметной области.

    1. Предметная область информационной системы

Предметная область (ПО) информационной системы рассматривается как совокупность реальных процессов и объектов (сущностей), представляющих интерес для её пользователей [7]. Каждая из сущностей ПО обладает определённым набором свойств (атрибутов), среди которых можно выделить существенные и малозначительные. Признание какого-либо свойства существенным носит относительный характер. Например, атрибут Должность для сотрудника является существенным, а для читателя библиотеки – малозначительным.

Примечание. В данном учебном пособии наименования сущностей, атрибутов и связей выделяются курсивом и подчёркиванием. Кроме того:

  1. Сущность записывается прописными буквами (ОТДЕЛ).

  2. Атрибут сущности начинается с прописной буквы (Название). Ключевой атрибут выделяется полужирным шрифтом (Табельный номер).

  3. Связь между сущностями определяется глаголом (работает).

Для упрощения процедуры формализации ПО в большинстве случаев прибегают к определению типов сущностей. Тип позволяет выделить из всего множества сущностей ПО группу сущностей, однородных по структуре и поведению (относительно рамок рассматриваемой ПО). Например, для ПО "Институт" в качестве типов сущностей могут рассматриваться студенты, преподаватели, дисциплины и т.п. Данные предметной области представляются экземплярами сущностей (студент Иванов, преподаватель Сидоров, дисциплина "Базы данных"). Экземпляры сущностей одного типа обладают одинаковыми наборами атрибутов, но должны отличаться значением хотя бы одного атрибута для того, чтобы быть узнаваемыми (например, студенты могут иметь одинаковые ФИО, но должны иметь разные номера зачётных книжек).

Между сущностями ПО могут существовать связи, имеющие различный содержательный смысл (семантику). Например, студент учится в группе, врач лечит пациента, клиент имеет вклад в банке. Связи могут быть факультативными или обязательными. Если вновь порождённая сущность одного из типов оказывается по необходимости связанной с сущностью другого типа, то между этими типами сущностей есть обязательная связь. Иначе связь является факультативной. Примеры обязательной и факультативной связей приведены на рис. 1.3. Здесь связь замещает является обязательной (изображается двойной линией), потому что каждый сотрудник должен работать на определённой должности, а связь замещается является факультативной, т.к. должность может быть вакантна.

Рис.1.3. Примеры обязательной и факультативной связей

Для удобства каждую связь между сущностями можно изображать одним ромбом (рис. 1.4). Выделяют также показатель кардинальности связи: "один к одному" (1:1), "один ко многим" (1:n) и "многие ко многим" (m:n) (рис. 1.4).

Рис.1.4. Примеры различной кардинальности связей

Связи, приведённые на рис. 1.4, с учётом семантики означают следующее:

  • пациент–койка (1:1) – каждый пациент занимает одну койку, каждая койка в каждый момент времени может быть занята только одним пациентом;

  • палата–пациент (1:n) – каждый пациент находится в одной палате, в каждой палате могут находиться несколько пациентов;

  • пациент–врач (n:m) – каждый пациент может лечиться у нескольких врачей, каждый врач может лечить несколько пациентов.

Обратите внимание: необязательная связь имеет модификатор "может", а у обязательной связи его нет.

Степень связи – это количество сущностей, которые входят в связь. Различают унарные (рис. 1.5,а), бинарные (рис. 1.5,б) и тернарные (рис.1.5,в) связи. (На практике связи с большей степенью редко используются). Унарная связь означает, что одни экземпляры сущности связаны с другими экземплярами этой же сущности (например, одни сотрудники руководят другими, а деталь может являться частью механизма).

Рис.1.5. Примеры связей различной степени

Различают тип связи и экземпляр связи. Тип связи определяется её именем, обязательностью, степенью и кардинальностью, например, бинарная связь учится между сущностями ГРУППА и СТУДЕНТ, обязательная для студента, кардинальностью 1:n. А экземпляр связи – это конкретная связь между студентом Сидоровым и группой Н-11, в которой он учится.

Совокупность типов сущностей и типов связей между ними характеризует структуру предметной области. Собственно данные представлены экземплярами сущностей и связей между ними. Данные экземпляров сущностей и связей хранятся в базе данных информационной системы, а описание типов сущностей и связей является метаданными.

Множества экземпляров сущностей, значения атрибутов сущностей и экземпляры связей между ними могут изменяться во времени. Поэтому каждому моменту времени можно сопоставить некоторое состояние предметной области. Состояния ПО должны подчиняться совокупности правил, которые характеризуют семантику предметной области. В базе данных эти правила могут быть заданы с помощью так называемых ограничений целостности, которые накладываются на атрибуты сущностей, типы сущностей, типы связей и/или их экземпляры. Фактически ограничения целостности – это правила, которым должны удовлетворять значения данных в БД. Например, для библиотеки можно привести такие ограничения целостности: количество экземпляров книги не может быть отрицательным; номер паспорта читателя должен быть уникальным; каждая книга относится к определённому разделу рубрикатора ББК – библиотечно-библиографической классификации и т.д.

Для того чтобы обеспечить соответствие базы данных текущему состоянию предметной области, база данных динамически обновляется (периодически или в режиме реального времени). Это обновление называется актуализацией данных. Актуализация может проводиться:

  • вручную, если изменения в данные вносит пользователь (например, запись сведений о выдаче абоненту книги в библиотеке);

  • автоматизированно, если изменения инициируются пользователем, но выполняются программно (например, обновление списка должников в библиотеке – читателей, которые просрочили дату возврата книг);

  • автоматически, если данные поступают в электронном виде и обрабатываются программой без участия человека (это касается, например, автоматизированных систем управления производством).

Правильность обновлений может контролироваться программно, но правильнее контролировать их автоматически с помощью ограничений целостности БД.

База данных является информационной моделью внешнего мира, некоторой предметной области. Во внешнем мире сущности ПО взаимосвязаны, поэтому в БД эти связи должны быть отражены. Если связи между данными в БД отсутствуют, то имеет смысл говорить о нескольких независимых БД и хранить их раздельно.



Скачать документ

Похожие документы:

  1. Пособие подготовлено на кафедре культурологи и социальной коммуникации, соответствует программе дисциплины и предназначено для студентов, обучающихся по специальности «Реклама». Удк 659. 1 (075. 8)

    Документ
    В учебном пособии изложены основы теории и практики современной рекламы. Рассматриваются комплексная природа рекламы как составной части маркетинга, а также виды, средства и потребительская аудитория рекламы.
  2. Отчет о работе российской академии образования

    Публичный отчет
    Психологические и физиологические закономерности и индивидуальные особенности развития и образования детей на разных этапах онтогенеза в современных социокультурных условиях
  3. А. С. Данилов отчет

    Публичный отчет
    В связи с проведением в ноябре 2008 года очередного лицензирования и аккредитации Федерального государственного образовательного учреждения высшего профессионального образования «Ростовская государственная консерватория (академия) им.
  4. Исаков Владимир Борисович, доктор юридических наук, профессор. М., Ниу вшэ. 2011. 349 с. Аннотация учебно-методический комплекс

    Учебно-методический комплекс
    УМК-МПИ: Учебно-методический комплекс для слушателей магистерской программы «Правовая информатика» на 2011-2012 и 2012-2013 учебный год. Автор-составитель: Исаков Владимир Борисович, доктор юридических наук, профессор.
  5. Ростовский Государственный Экономический Университет (ринх)» «Утверждаю» ректор университета Кузнецов Н. Г. 30 июня 2009 г отчет

    Публичный отчет
    4.1. Соответствие разработанных общеобразовательных программ (ООП) и учебно-методической документации требованиям государственного образовательного стандарта высшего профессионального образования

Другие похожие документы..