Реферат: Принципы реализации машин БД

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">            Основысовременной информационной технологии составляют базы данных (БД) и системыуправления базами данных (СУБД), роль которых как единого средства хранения,обработки и доступа к большим объемам информации постоянно возрастает. При этомсущественным является постоянное повышение объемов информации, хранимой в БД,что влечет за собой требование увеличения производительности таких систем.Резко возрастает также в разнообразных применениях спрос на интеллектуальныйдоступ к информации. Это особенно проявляется при организации логическойобработки информации в системах баз знаний, на основе которых создаютсясовременные экспертные системы.

Быстрое развитие потребностей применений БД выдвигает новые требования к СУБД:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
поддержка широкого спектра типов представляемых данных и операций над ними(включая фактографические, документальные, картинно-графические данные) ;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
естественные и эффективные представления в БД разнообразных отношений междуобъектами предметных областей (например, пространственно-временных собеспечением визуализации данных);

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
поддержка непротиворечивости данных и реализация дедуктивных БД;
обеспечение целостности БД в широком диапазоне разнообразных предметныхобластей и операционных обстановок;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
управление распределенными БД, интеграция неоднородных баз данных;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
существенное повышение надежности функционирования БД. Вместе с темтрадиционная программная реализация многочисленных функций современных СУБД наЭВМ общего назначения приводит к громоздким и непроизводительным системам снедостаточно высокой надежностью. Тем более затруднительным оказываетсянаращивание программных средств, обеспечивающих перечисленные выше требования.Это обусловлено рядом причин:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
фон-неймановская архитектура ЭВМ неадекватна требованиям СУБД, в частностиреализации поиска, обновления, защиты данных, обработки транзактов толькопрограммным способом неэффективны как по производительности, так и постоимости;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
многоуровневое и сложное программное обеспечение СУБД снижает эффективность инадежность функционирования БД;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
универсальная ЭВМ оказывается перегруженной функциями управлениями базамиданных, что снижает эффективность функционирования собственно прикладныхсистем;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
централизация и интеграция данных в сетях персональных и профессиональных ЭВМнереализуема с приемлемой стоимостью без включения в состав сетейспециализированных ЭВМ для поддержки функции СУБД.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Эти соображения приводят к мысли онеобходимости создания специализированных автономных информационных систем,ориентированных исключительно на реализацию функций СУБД. Однако системы,реализованные на обычной универсальной мини- или микроэвм, не способныполностью решить указанные проблемы. Необходим поиск новых архитектурных иаппаратных решений. Исследования в этом направлении привели кпоявлению-проектов и действующих прототипов машин баз данных, которые наряду ссамостоятельным назначением составляют также основу вычислительных систем 5-гопоколения. Машиной баз данных (МБД) принято называть аппаратно-программныймультимикропроцессорный комплекс, предназначенный для выполнения всех илинекоторых функций СУБД.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
Такие свойства реляционной модели данных, как возможность расчленения отношенийна непересекающиеся группы, возможность массовой и параллельной обработки,простота и независимость данных в этой модели, а также наличие развитой теорииреляционных баз данных и аппарата сведения к реляционной других моделей данныхобусловили разработку МБД, ориентированных в основном на поддержку реляционныхбаз данных. В настоящее время очевидна правильность такого выбора в связи сустановлением возможности оперировать объектами баз знаний на реляционномконцептуальном уровне посредством операций реляционной алгебры.

Первые публикации по МВД появились в 1974 г., сейчас можно назвать более 50проектов, некоторые уже реализованы в виде промышленных прототипов и являютсякоммерческими изделиями. Исследования по аппаратурной поддержке операций надбазами данных проводятся и в нашей стране. Основными критериями для оценки тогоили иного проекта являются полнота выполняемых функций СУБД и ожидаемоеповышение производительности при их выполнении. Это одинаково важно как дляМБД, функционирующих совместно с главной ЭВМ в составе единой вычислительнойсистемы, так и для МБД, являющейся узлом локальной сети (data computer). Во всехсовременных проектах и коммерческих МБД реализован полный объем функций СУБД.Повысить производительность, учитывая ограниченные скоростные характеристикисовременной элементной базы, можно только структурными методами (за счетструктурного распараллеливания). В силу этого МБД являются специализированнымипараллельными вычислительными системами, и при их проектировании требуютсяединая методология сравнения и четкие критерии оценки производительности. Внастоящее время ведутся интенсивные исследования в этой области.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
Основными техническими приемами, применяемыми в структурных методах повышенияпроизводительности МВД, являются следующие:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
использование многоканальных устройств массовой памяти (УМП) со встроенными ваппаратуру каналов процессорами поиска и фильтрации для уменьшения объемовперекачиваемых данных из УМП в обрабатывающие подсистемы;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
использование буферизации между основной памятью обрабатывающих процессоров иУМП, которая не только сглаживает разницу в скоростях обработки данных и чтенияих в УМП, но и уменьшает частоту обращения к УМП;

сегментация данных в УМП, которая увеличивает локальность доступа и улучшаетэффект двух предыдущих методов; с этой целью предполагается развитиемультиатрибутной кластеризации и индексации данных в УМП и аппаратная ихподдержка;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
использование ассоциативной памяти в качестве буферной и соответствующихалгоритмов обработки данных;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
развитие подсистем опережающей выборки данных в буферную память (стадированиеданных) и оптимизация алгоритмов управления виртуальным пространством данных;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
реализация режимов параллельной интерпретации каждой операции над БД(горизонтальный параллелизм типа SIMD) и режимов конвейерной и потоковойобработки не только операций, но и транзакций в целом;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
функциональная специализация процессоров обработки и их аппаратная реализация ввиде СБИС.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
Основные направления развития структур МВД:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
Можно выделить два обобщенных направления, в которых ведутся исследования поструктурным методам повышения производительности МВД: многопроцессорные неоднородные(МН) и сетевые МВД. На рис. 1 приведены обобщенные топологические схемы такихМВД. Частным случаем МН МВД можно считать коммерческие МВД IDM-500, RS-310,iDBP 86/440, топологическая схема которых приведена на рис. 2.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><img src="/cache/referats/2217/image002.jpg" v:shapes="_x0000_i1025">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Рис. 1. Топология двух классов МВД:

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">а — многопроцессорные неоднородные МВД с несколькими уровнями обработки

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">б — сетевые МВД

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">К МН МВД можно отнести большинствосовременных проектов МВД, таких как DELTA, GRACE, DSDBS, MPDC, SABRE и др.Основными особенностями МН МВД являются следующие.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
1. Наличие нескольких уровней обработки данных, в частности, трех основных:

селекция и первичная фильтрация данных непосредственно в контрольныхустройствах массовой памяти;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
вторичная обработка, заключающаяся в реализации операций реляционной алгебрынад вспомогательными отношениями, полученными на первом этапе;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»"><img src="/cache/referats/2217/image004.jpg" v:shapes="_x0000_i1026"><span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">/

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">-универсальный обрабатывающий             /__/-коммуникационныйпроцессор
     процессор (серийныймикропроцессор)

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">   

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">- специализированный                                        — коммутирующееустройство (общая
      обрабатывающийпроцессор                             шина, переключательная матрица,
О — локальная полупроводниковая память             кольцеваякоммутирующая шина,
                                                                                  коммутирующая сеть)

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; color:blue">       

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">- буферная общедоступная память                 — Управляющий процессор(подсистема)

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;color:blue">    

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">- устройство массовой памяти
       с контроллером (НМД с контроллером)

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Рис. 2. Топология коммерческих МБД

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">структурная обработка или обработкаметаданных, заключающаяся в поддержке вспомогательных структур данных(индексация, мультиатрибутная кластеризация) .

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
2. Наличие системной буферной памяти (СБП) между первыми двумя уровнямиобработки, в которой помещаются отношения или вспомогательные структуры данных,полученные на первом уровне обработки. Такая архитектура предполагает наличиеопережающей выборки и подкачки данных из уровня первичной обработки(стадирование). СБП при этом обязательно должна быть двух или более портовой.

3. Наличие функционального параллелизма, при котором различные функциипервичной и вторичной обработки реализуются на физически распределеннойаппаратуре. При этом часть функциональных устройств реализуется науниверсальных микропроцессорах, часть в виде спецаппаратуры (например, заказныхСБИС). Функциональный параллелизм позволяет реализовать конвейерное выполнениетранзакций и отдельных запросов. В более общих случаях для увеличенияпроизводительности допускается дублирование функциональных процессоров нанаиболее трудоемких операциях.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
В качестве наиболее типичных примеров таких МН МВД можно рассмотреть DELTA иGRACE. Японский проект МВД (рис. 3) лежит в основе вычислительной системы 5-гопоколения. Действующий в настоящее время прототип состоит из двух подсистем:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><img src="/cache/referats/2217/image006.gif" v:shapes="_x0000_i1027">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">
подсистемы вторичной обработки в составе четырех реляционных процессоров (РП),одного процессора управления (УП), одного коммуникационного процессора (КП) и одного процессора технического обслуживания(НТО), выполняющего функции диагностикисистемы, поддержки БД, связи с операторам и т. п.;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">подсистемы иерархической памяти (ИЛ),содержащей системную буферную память(электронный кэш-диск емкостью 128 Мбайт), массовую память с восемью НМД (с контроллером магнитного диска КМД) общей емкостью 20 Гбайт и четырьмя НМЛ (сконтроллером магнитной ленты — КМЛ), а такжеуниверсальную микроэвм в качестве управляющего процессора иерархической памяти (УПИП) и процессора ввода-вывода(ПЕВ). Связь между подсистемами осуществляетсявысокоскоростным каналом со стандартным интерфейсом со скоростью передачи до 3Мбайт/с. Все процессоры подсистемы вторичной обработкиподключаются к этому каналу посредством ПВВ черезспециальные адаптеры иерархической памяти (АИП).

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Основным функциональным узлом МЕД DELTAявляется реляционный процессор (РП) баз данных,назначение которого-выполнение операций реляционной алгебрынад отношениями произвольного объема с высокой производительностью.Каждый из четырех РП может выполнятьотдельную операции:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">процессора (КП)и одного процессора технического обслуживания (НТО), вы­полняющегофункции диагностики системы, поддержки БД, связи с операто­ром и т. п.;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">подсистемы иерархической памяти (ИЛ),содержащей системную буфер­ную память (электронный кэш-диск емкостью 128Мбайт), массовую память
с восемью НМД (с контроллером магнитного диска КМД) общейемкостью
20 Гбайт и четырьмя НМЛ (с контроллером магнитной ленты — КМЛ), а так­
же универсальную микроэвм в качестве управляющего процессора иерархиче­скойпамяти (УДИЛ) и процессора ввода-вывода (НЕЕ). Связь между под­системамиосуществляется высокоскоростным каналом со стандартным интер­фейсом соскоростью передачи до 3 Мбайт/с. Все процессоры подсистемы вторичной обработкиподключаются к этому каналу посредством ПВВ черезспециальные адаптеры иерархической памяти (АИП).

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Основным функциональным узлом МЕД DELTAявляется реляционный
процессор (РП) баз данных, назначениекоторого-выполнение операций ре­ляционной алгебры над отношениями произвольногообъема с высокой произ­водительностью. Каждый из четырех РП может выполнять отдельную операцию реляционнойалгебры независимо от других или все они могут выполнять одну операциюпараллельно (например, сортировку отношений в ИЛ). РП имеетрегулярную структуру (см. рис. 3) для облегчения его реализации в виде СБИС.Кроме этого он в своем составе имеет центральный процессор (ЦП) с памятью 512Кбайт для реализации операций с обширной логикой (например, агрегатных функцийтипа min, mах и т. п.).Для облегчения входного  (ВП) ивыходного (ВЫП) потока данных РП содержит дваадаптера иерархической памяти (АИП), а такжевходной модуль для подготовки кортежей отношений (например, перестановкизначений атрибутов). Собственно операция реляционной алгебры реализуется в РП. Процессор слияния (ПСЛ) сортированныхсегментов отношений предназначен для слияния сортированных сегментов отношений,а также в нем реализуются операции естественного соединения двух отношений иселекции отношения. Двенадцать процессоров сортировки (ПСО)предназначены для реализации конвейерной однопроходовойсортировки сегмента отношения объемом 64 Кбайт. ПСОи ПСЛ реализованы полностью аппаратно.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Иерархическая память в DELTA являетсянаиболее сложной подсистемой, в функции которой входят:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">управление СЕЛ и УМП;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">стадирование

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">данных (в виде сегментов отношений) из УМП в СБП в соответствии с заявками РП;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">селекция и вертикальная фильтрацияотношений при помещении их в СБП с привлечением специального (атрибутного)метода хранения отношений в УМП;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">поддержка индексных структур,кластеризация отношений в УМП и организация сих помощью быстрого поиска в УМП.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><img src="/cache/referats/2217/image008.jpg" v:shapes="_x0000_i1028">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Рис. 4. Структурная схема МВД GRACE

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Вторым примером МН МВД является также японский проект GRACE, структурная схема которого приведена на рис. 4. СБП реализована здесь набором электронных дисков нацилиндрических магнитных доменах. В качестве УМП использованымногоканальные НМД, в каждый канал которых встроены, кроме устройствчтения-записи (Уч/з), процессоры первичнойобработки, названные фильтрами потока кортежей (ФПК). КаждыйФПК содержит:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">процессор фильтрации (ПФ), осуществляющий в пределах дорожки МД собственно псевдоассоциативныйпоиск кортежей, удовлетворяющих заданному условию;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">процессор проекции (ПП) ипреобразования кортежей;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">
процессор хэширования (ПХ), реализующий динамическую сегментацию
кортежей читаемого отношения.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Фильтр потока кортежей работает вконвейерном режиме и позволяет обрабатывать поступающие из УМП кортежи со скоростью их чтения (обработка «вполете»).

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">      На уровне вторичной обработки применяются процессоры вторичной обработки(ПВО) и ФПК. НазначениеФПК — выполнять описанную выше обработкукортежей результирующих отношений, поступающих из ПВО вСЕЛ. ПВО содержит наряду с процессоромреляционной алгебры (ПРА), реализованным наоснове универсального микропроцессора со своей локальной памятью, такжеаппаратный процессор сортировки отношений (ПСО) ипроцессор выдачи результата (ПВР) в каналглавной ЭВМ. ПСО осуществляет потоковуюсортировку сегмента отношения, поступающего из банка СЕЛ в процессорреляционной алгебры. Двухпортовые банки СЕЛподсоединяются к процессорам обработки обоихуровней посредством специальных петлевых шин (СПШ). Этимногоканальные шины с разделением времениосуществляют на каждом уровне обработки коммутацию любого процессора обработкик любому банку памяти и одновременную обработкунескольких банков памяти.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Отличительными особенностями данногопроекта являются следующие структурные решения.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">1. Метод опережающей подкачки кортежейиз УМП в СБП сочетаетздесь не только с первичной фильтрацией, но и со специальным распределениемкортежей по банкам СЕЛ. Эта так называемая динамическая хэш-сегментация позволяет выполнять операции реляционной алгебрына уровне вторичной обработки параллельно и безобменов несколькими ПPA, так что каждый ПРА реализует бинарную операцию над паройсоответствующих сегментов отношений-операндов. Это является одним из источниковповышения производительности МБД при выполненииопераций реляционной алгебры.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">2. Включение в цикл вторичной обработкифильтров потока кортежей, используемых в циклепервичной обработки, позволяет обрабатывать промежуточные отношения в СБП, так же как и исходные отношения БД, единообразно интерпретировать последовательностьопераций реляционной алгебры. Таким образом, выполнение транзакции, соответствующей сложному запросу к реляционной БД, заключается в многократном выполнениициклов первичной и вторичнойобработки.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">3.Предварительная и параллельная фильтрация данных со скоростью их поступления изУМП позволяет снизить объем перемещаемых из УМП в СБП данных, чтоявляется существенным источником повышения производительностиМБД в целом. Этот механизм используется во многих (если не во всех)проектах МН МБД и считается признаннымрешением.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Как показали многочисленныеисследования, СУБД не может быть эффективной, еслибольшая часть ее работает под управлением операционной системы общегоназначения. Поэтому повышение эффективности МБД связанос полной изоляцией СУБД в рамках МВД, т. е. реализациейфункционално-полных МВД, выполняющих все функции управления транзакциями. Учитывая сложность соответствующейоперационной системы МБД, реализовать функционально полную и высокопараллельную МН МВД сложно.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Втораяосновная проблема в создании высокопараллельных МНМБД, названная «дисковым парадоксом», заключается в том, что скорость ввода-вывода современных УМП (одноканальные и многоканальные НМД сперемещающимися головками) является узким местом и ограничиваетдостижение высокого параллелизма в обработке. В МНМБД для решения этой проблемы в качествекэш-диска применяется большая полупроводниковая буферная память.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Длярешения этой проблемы некоторые авторы предлагают сетевые МБД в которых распределенное хранение больших БДосуществляется на большем количестве НМД.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Сетевые МВД (см. рис. 1, б) воплощают принципы однородности структуры, сегментации данных в устройствах массовойпамяти и распределения процессоров обработки поУМП. Таким образом, основная идея сетевых MBД — приближение дешевой обрабатывающей логики (ввиде универсальных микропроцессоров) к УМП и связывание таких «обрабатывающих хранилищ» всеть. Учитывая быстро снижающуюся стоимость процессоров oбработки и жестких НМД и успехи в технике коммуникациипроцессоров, в ее составе такой сети может быть сотни УМП,с каждым из которых соединен свой обрабатывающийпроцессор. Примерами таких проектов являются МВО; GAMMA. В перспективе развития сетевых MB.Д некоторые авторы видят создание МВД на основевычислительной систолической среды. Так, проектNODD, схема которого изображена на рис. 5, реализован в виде регулярной решетки, вузлах которой размещены процессорные элементы (ПЭ). С каждым ПЭ связанысвоя локальная память (ЛП) и устройствомассовой памяти (УМП) в виде жесткого НМД.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><img src="/cache/referats/2217/image010.gif" v:shapes="_x0000_i1029">

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Предполагается также замена УМП энергонезависимой полупроводниковой памятьюсоответствующей емкости («силиконовая» систолическаяМВД). Назначение ЛП в каждом узле-хранениепрограмм обработки, копии управляющей программы, буфера для обмена сообщениямии кэш-памяти для своего УМП (3% каждоголокального УМП находится в этой локальнойкэш-памяти). Для целей надежности пространство на каждом УМП разделено на части: одна часть для хранения частиБД, принадлежащей своему узлу, другая-дублирует данные четырех соседних узлов.Особенностью является и то, что управление выполнением транзакций в такихсетевых МВД полностью распределено, так что каждый процессор может взять насебя роль управляющего.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Особый интерес приобретает созданиесистолических МВД в связи с появлением серийных однокристальных транспьютеров,содержащих наряду с процессором и памятью каналы (порты ввода-вывода).Например, промышленный транспьютер фирмы INMOS IMSТ414 имеет следующие характеристики. Водном кристалле реализован 32-разрядный процессор быстродействием до 10 млн. опер./с, статическое ОЗУ на 2 Кбайт, четыре каналасвязи, 32-разрядный интерфейс памяти и контроллер динамического ОЗУ.Конструктивно транспьютерная матрица, являющаяся основным элементомсистолических транспьютерных МВД (см. рис. 5), может быть реализованапосредством серийных транспьютерных плат IMS ВОООЗ тойже фирмы. Эта двойная европлата содержит четыретранспьютера Т414, связанных между собойпортами связи, четыре устройства динамической памяти по 256 Кбайт каждое ичетыре внешних порта ввода-вывода. Возможно, в ближайшее время применение такихтранспьютерных плат переведет проекты систолических МВД из области теоретическихисследований в область практической реализации.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><img src="/cache/referats/2217/image012.gif" v:shapes="_x0000_i1030">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Основной проблемой в распределенных(сетевых) МБД является оптимальнаякластеризация данных по локальным УМП иподдержка соответствующей распределенной индексации. В GAMMA, например,предлагается кластеризация каждого отношения по всем УМП(в соответствии с хешированием значенийключевых атрибутов и созданиемраспределенного по УМП индекса этих значений).В NODD предлагается равномерное распределениеотношений по  узлам решетки. Междуконкретными кортежами разных отношений, для которых действуют семантическиесвязи, существуют указатели, задающие расположение связанных кортежей (номераузлов и их адреса в УМП). Таким образом, запросв БД возбуждает связи между кортежами в узлах решетки и порождает поток данныхмежду ними. Это позволяет реализовать в такой МВД потоковую обработку сложныхзапросов на основе модели «активного графа»

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">К классу сетевых относится коммерческаяМВД фирмы Teradata DBC 1012, которая интенсивнораспространяется и находит широкое применение в разлиных информационныхсистемах. На рис. 6 изображена конфигурация DBC 1012 с восемью обрабатывающими процессорами ПМД (на базе i80386), каждый из которых имеет НМД иподключается к коммуникационной сети типа двоичного дерева (Y-сеть). В узлы этой сети встроены сетевыевысокоскоростные процессоры и программируемые логические матрицы, реализующиефункции управления сетью. Y-сеть позволяетосуществлять дуплексный обмены между обрабатывающими процессорами. В эту жесеть подключаются коммуникационные процессоры (ИЛ) для осуществления интерфейсас главной ЭВМ. Каждый обрабатывающий процессор обеспечивает поддержку всехопераций реляционной алгебры, достаточных для выполнения операторов SQL,поддержку своей части БД, а также выполнение всех функций управлениятранзакциями над своей частью БД, в том числе защиту целостности,восстановления и т. д. Образцы DBC 1012 включают до 128 процессоров и имеютраспределенную по обрабатывающим процессорам полупроводниковую память емкостью412 Мбайт на один процессор. Общая емкость массовой памяти составляет до 1000Гбайт и общее быстродействие — до 10^9опер./с.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><img src="/cache/referats/2217/image014.gif" v:shapes="_x0000_i1031">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Два свойства DBC1012 характерны для всех сетевых МЕД:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">      обеспечение возможности увеличения мощности наращиванием числаобрабатывающих процессоров, так что производительность при этом растет линейно(показатель линейности роста производительности DBC 1012от числа процессоров составляет 97%);

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">обеспечение надежности функционированияза счет дублирования данных в локальных УМП (т.е. обеспечивается работа без краха системы привыходе из строя отдельных процессоров или УМП).

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»;color:blue">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Третье направление исследований вобласти МБД заключается в создании недорогих коммерческих устройств на серийныхпроцессорных элементах с шинным интерфейсом (топология таких МБД изображена нарис. 2, а). В качестве примера рассмотрим МБД фирмы BrittonLee IDM 500, структурная схема которойизображена на рис. 7. Хотя эти  изделия не ориентированы навысокопараллельную обработку и содержат ограниченное число функциональныхпроцессоров, они удовлетворяют сформулированным выше принципам МН МБД и полностью реализуют все основные функцииМБД. Структурная схема коммерческих МБД является частным случаем МН МБД (см. рис. 2,a). Роль СБП выполняетполупроводниковая память, к которой через общую шину подключаются периферийныеконтроллеры НМД со встроенными микропроцессорами AMD 2901,процессор обработки (процессор БД) на основе Z8002 идо 8 канальных процессоров для подключения к главной ЭВМ (канал IBM 370,интерфейс с VAX 750) или подключения к локальной сети (Ethernet). Кроне того, кобщей шине может подключаться особый функциональный процессор (акселератор БД) для выполнения тех операций, которые являютсяузким местом (например, сортировка отношений).Старшая модель IDM SOO/XL с емкостью внешнейпамяти более 1 Гбайт на жестких МД и 500 Мбайтна МЛ имеет производительность 1000транзакций/мин и одновременно обслуживает до 400 пользователей.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Развитием этого направления вразработках фирмы Britton Lee явилсяреляционный файлсервер (data/file server) RS310 — автономное устройство, подключаемое клокальной сети Ethernet или непосредственно к главной ЭВМ по интерфейсу RS232. Он включает:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">       собственно процессор базы данных (1 плата) на основе 28000 (10 Мгц); соединенную с этим процессоромоперативную память емкостью 1 Мбайт на одной плате;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">два жестких диска типа винчестер (5 1/4дюйма) по 80 Мбайт каждый с соответствующим контроллером;

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">контроллеркассетной МЛ с 60 Мбайт на кассете (Streaming tape 1/4 дюйма);

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">до четырех интерфейсных плат двух типов(интерфейс RS232 с восемью выходами илиинтерфейс локальной сети Ethernet).

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Каждая интерфейсная плата содержитпроцессор 28000 и свою локальную память. ,RS310 может быть использован или как автономная СУБД с выходным языком SQL, поддерживая при этом всефункции СУБД, за исключением первого этапатрансляции с SQL (управление транзакциями, параллельное выполнение запросов,откаты и восстановления, автоматическую оптимизацию запросов и т. п.), или как интегрированная система управленияфайлами. При этом RS310 выступает для главнойЭВМ в качестве интеллектуального контроллера с буферизацией и удовлетворяетинтерфейсу SCSI (Small Computer System Interface). RS310обеспечивает одновременную работу до 50 пользователей и выполняетодновременно до 10 запросов. Ближайшая перспектива развития RS310 — увеличение внешней памяти до восьми НМДемкостью 478 Мбайт и МЛ емкостью 300 Мбайт.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»"><img src="/cache/referats/2217/image016.gif" v:shapes="_x0000_i1032">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Рис. 8. Специализированная машина дляБД PYRAMID S 9810 (9820)

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Дальнейшим развитием такого подхода ксозданию коммерческих МБД является ихреализация на модульной параллельной мультимикропроцессорнойсистеме типа систем S27 и S81 фирмы Sequent и систем серии 9000 (9810, 9820)фирмы Pyramid-Sybase. На рис. 8 изображена структурная схема нового изделияфирмы Pyramid--система 9810(9820),являющаяся специализированной ЭВМ для БД. Эта специализированная машинапредназначена для автономной поддержки СУБД Sybase с входным языком SQL, атакже для поддержки прикладных информационных систем на основе этой СУБД дляавтоматизации конторской деятельности, разработки программного обеспечения и т.п. Система работает как data computer в сетиЭВМ и имеет интерфейс не только с локальной сетью Ethernet, но и Х25, telenet, darpa. Общаядисковая память достигает 15 Гбайт. Основная память, подключаемая к устройствууправления памятью в виде плат до 4 и 16 Мбайт, может наращиваться до 128Мбайт. В системе поддерживается виртуальное адресное пространство 4 Гбайт состраницами в 2048 байт. В качестве процессоров обработки выступают один или дваспецпроцессора (CPU), реализованные в виде 32-разрядных процессоров с RISC-архитектурой.CPU имеет следующие характеристики:

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»">время цикла- 100 нс;
число 32-разрядных регистров — 528;
кэш-память инструкции- 16 Кбайт;
кэш-память — 64 Кбайт.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">В RISC-процессорах реализованконвейерный режим выполнения инструкций.

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">Основой системы является собственная сверхбыстрая шина xtend
(40 Мбайт/с), работающая по принципу ком

еще рефераты
Еще работы по программированию, базе данных