Виды информационных технологий

       

Лекция 7.Технология обработки данных


При использовании информационных технологий компьютерных сетей становится возможной реализация территориального распределения производства. Появляются проблемы, связанные с межконтинентальным снабжением, поясным временем и т.д. , реализация которых становится возможной благодаря новейшим сетевым технологиям и развитию коммуникаций.

Одной из важнейших сетевых технологий является распределенная обработка данных. Персональные компьютеры (ПК) устанавливаются на рабочих местах, т.е. на местах возникновения и использования информации, и соединяются каналами связи. Это дает возможность распределить ресурсы ПК по отдельным функциональным сферам деятельности и изменить технологию обработки данных в направлении децентрализации. Распределенная обработка данных предоставляет пользователю ряд преимуществ:

- большое число взаимодействующих между собой пользователей, выполняющих функции сбора, регистрации, хранения, передачи и выдачи информации;

-         снятие пиковых нагрузок с централизованной базы путем распределения обработки и хранения локальных баз данных на разных ЭВМ;

-         обеспечение доступа информационного работника к вычислительным ресурсам сети ЭВМ;

-         обеспечение симметричного обмена данными между удаленными пользователями.

Введение классификации моделей представления данных на иерархические, сетевые и реляционные отразилось на архитектуре систем управления базами данных и технологии их обработки. Архитектура системы управления базой данных (СУБД) описывает ее функционирование как взаимодействие процессов двух типов: клиента и сервера.

Существуют два понятия распределенная обработка и распределенная база данных, которые не являются синонимами. Если при

распределенной обработке производится работа с базой данных, то представление данных, их содержательная  обработка, работа с базой на логическом уровне выполняются на ПК клиента, а поддержание БД в актуальном состоянии – на сервере.
В случае использования распределенной базы данных БД размещается на нескольких серверах. Работа с базой данных осуществляется на этих же или других ПК, и для доступа к удаленным данным необходимо использовать сетевую СУБД.

В системе распределенной обработки клиент может послать запрос к собственной локальной базе данных или к удаленной БД. Удаленный запрос – это единичный запрос к одному серверу. Несколько удаленных запросов    к одному серверу объединяются в удаленную транзакцию. Если отдельные запросы транзакции обрабатываются различными серверами, то транзакция называется распределенной. При этом один запрос обрабатывается одним сервером. Распределенная СУБД позволяет обрабатывать один запрос несколькими серверами. Такой запрос называется распределенным. Только обработка распределенного запроса поддерживает концепцию распределенной базы данных.

Базы данных – это автоматизированные хранилища оперативно обновляемой информации. В настоящее время созданы БД по всем направлениям человеческой деятельности: финансовой, экономической, научно-технической, электронной документации, кредитной, статистической, маркетинга, газетных сообщений, правительственных распоряжений, патентной информации, библиографической и т.д. При этом все БД делятся на коммерческие и общественные.



Организация обработки данных зависит от способа их распределения. Существуют централизованный, децентрализованный и смешанный способы распределения данных.

Централизованная организация данных является самой простой для реализации (Рис.5).

 

                                                                                                                                                            

Рис.5. Централизованная организация данных

На одном сервере находится единственная копия базы данных. Все операции с БД обеспечиваются этим сервером. Доступ к данным выполняется с помощью удаленного запроса или удаленной транзакции. Достоинством данного способа является простая поддержка базы данных в актуальном состоянии.


Недостатки централизованной организации данных:

-         размер БД ограничен размером внешней памяти;

-         все запросы направляются к одному серверу с соответствующими затратами на стоимость связи и временную задержку;

-         ограничение на параллельную обработку;

-         недоступность для удаленных пользователей при появлении ошибок связи;

-         выход из строя при отказе центрального сервера.

Децентрализованная организация данных предполагает разбиение информационной базы на несколько физически распределенных БД. Каждый клиент пользуется своей БД, которая может быть либо частью общей информационной базы данных (Рис.6), либо копией информационной БД в целом (Рис.7), что приводит к ее дублированию для каждого клиента.

                                                                                                                                                            

Рис.6. Децентрализованная организация данных

способом распределения

                                                                                                                                                            

Рис.7. Децентрализованная организация данных

способом дублирования

При распределении данных на основе разбиения база данных размещается на нескольких серверах. Существование копий отдельных частей недопустимо. Достоинства метода:

-         большинство запросов удовлетворяются локальными базами данных, что сокращает время ответа;

-         увеличиваются доступность данных и надежность их хранения;



-         стоимость запросов на выборку и обновление снижается;

-         система остается частично работоспособной при выходе из строя одного из серверов.

Недостатки метода:

-         часть удаленных запросов или транзакций может потребовать доступ ко всем серверам, что увеличивает время ожидания и цену обслуживания;

-         хранение сведений о размещении данных в различных БД.

Деление базы данных наиболее целесообразно при совместном использовании локальных и глобальных компьютерных сетей.

Метод дублирования предполагает размещение на каждом сервере полной базы данных, что обеспечивает наибольшую надежность хранения.

Недостатки метода:

-       повышенные требования к объему внешней памяти;

-       усложнение корректировки БД.

Достоинства метода:

-         быстрый доступ в результате локального выполнения запросов;

-         высокая надежность хранения данных.

Метод дублирования используется, когда фактор надежности является критическим, БД небольшая, интенсивность обновления невелика.

Смешанная организация хранения данных объединяет два способа распределения: разбиение и дублирование (Рис.8).

Появляется необходимость хранить информацию о том, где находятся данные в сети. При этом достигается компромисс между объемом памяти под БД в целом и под БД на каждом сервере, чтобы обеспечить надежность и эффективность работы. Данный метод легко реализует параллельную обработку, т.е. обслуживание распределенного запроса или транзакции.

Несмотря на гибкость смешанного способа организации данных, остается проблема взаимозависимости факторов, влияющих на производительность системы, проблема ее надежности и выполнения требований к памяти. Смешанный способ организации данных можно использовать только при наличии сетевой СУБД.



                                                                                          

Рис.8.Смешанная организация данных

В базах данных коллективного пользования центральным технологическим звеном становятся серверы баз данных. Программные средства серверов баз данных обеспечивают:

-         реализацию многопользовательских приложений;

-         централизованное хранение данных;

-         целостность и безопасность данных.

Производительность серверов баз данных на порядок выше по сравнению с файл-серверами, которые используются в локальных вычислительных сетях. Использование серверов баз данных обеспечило доступ многих пользователей к одним и тем же файлам, что послужило предпосылкой создания сетевых СУБД.

Мощность сетевых СУБД, основанных на файл-сервере, в настоящее время недостаточна. В нагруженной вычислительной сети неизбежно падает производительность, нарушаются безопасность и целостность данных.

Технология клиент-сервер, как более мощная, заменила технологию файл-сервер и позволила совместить достоинства однопользовательских систем (высокий уровень диалоговой поддержки, дружественный интерфейс, низкая цена), с достоинствами более крупных компьютерных систем (поддержка целостности, защита данных, многозадачность).

В классическом понимании СУБД представляет собой набор программ, позволяющих создавать и поддерживать базу данных в актуальном состоянии. Функционально СУБД состоит из трех частей:

-         ядра (базы данных);

-         языка;

-         инструментальных средств программирования.

Инструментальные средства программирования относятся к интерфейсу клиента, или внешнему интерфейсу и могут включать процессор обработки данных на языке запросов.



Язык – это совокупность процедурных и непроцедурных команд, поддерживаемых СУБД. Наиболее часто используются SQL, QBE.

Ядро выполняет все функции по обработке БД.

Основная идея технологии клиент – сервер заключается в расположении серверов на более мощных компьютерах, а приложений клиентов – на менее мощных. Ввод-вывод к базе основывается не на физическом добавлении данных, а на логическом, т.е. сервер отправляет клиентам не полную копию БД, а только логически необходимые порции, тем самым сокращая график сети (поток сообщений сети). В технологии клиент-сервер программы клиента и его запросы хранятся отдельно от СУБД. Сервер обрабатывает запросы клиентов, выбирает необходимые данные из БД, посылает их клиентам по сети, производит обновление информации, обеспечивает целостность и сохранность данных.

Основные виды технологии распределенной обработки данных

К основным видам технологии распределенной обработки данных относятся следующие:

1)    технология клиент-сервер, ориентированная на автономный компьютер, т.е. и клиент, и сервер размещены на одной ЭВМ. По функциональным возможностям такая система аналогична централизованной СУБД;

2)    технология клиент-сервер, ориентированная на централизованное распределение. Клиент получает доступ к данным одиночного удаленного сервера, данные могут только считываться, динамический доступ к данным реализуется посредством удаленных транзакций и запросов, число которых должно быть невелико;

3)    технология клиент-сервер, ориентированная на локальную вычислительную сеть. Имеется единственный сервер, который обеспечивает доступ к БД; клиент формирует процесс, отвечающий за содержательную обработку данных, их представление и логический доступ к базе; доступ к базе данных замедлен, так как клиент и сервер связаны через локальную сеть;

4)    технология клиент-сервер, ориентированная на изменения данных в одном месте; реализует обработку распределенной транзакции; удаленные серверы не связаны между собой сетью ЭВМ; распределенная СУБД должна иметь средство контроля совпадения противоречивых запросов; распределение данных реализует метод разделения;



5)    технология клиент-сервер, ориентированная на изменение данных в нескольких местах, предполагает наличие сервера-координатора, поддерживающего протокол передачи данных между различными серверами; возможна обработка распределенных транзакций в разных удаленных серверах; реализуется стратегия смешанного распределения путем передачи копий с помощью СУБД;

6)    технология клиент-сервер, ориентированная на распределенную СУБД, обеспечивает стратегию разбиения и дублирования, обеспечивает более быстрый доступ к данным; распределенная СУБД обеспечивает независимость клиента от места размещения сервера, глобальную оптимизацию, распределенный контроль целостности БД, распределенное административное управление.

Во всех перечисленных технологиях существуют два способа связи прикладных программ клиента и сервера баз данных:

1)    прямое соединение – прикладная программа клиента связывается непосредственно с сервером базы данных;

2)    непрямое соединение – доступ к удаленному серверу обеспечивается средствами локальной базы.

Возможно объединение обоих способов.

Использование технологии клиент-сервер позволяет перенести часть работы с сервера на компьютер клиента, оснащенный инструментальными средствами для формирования его профессиональных обязанностей. Тем самым данная технология позволяет независимо наращивать возможности сервера баз данных и совершенствовать инструментальные средства клиента.

Недостатки технологии клиент-сервер заключается в повышении требований к производительности ЭВМ – сервера, в усложнении управления вычислительной сетью, а при отсутствии сетевой СУБД – в сложности организации распределенной обработки.

Под операционной средой сервера баз данных понимают возможности ОС компьютера и сетевой ОС. Каждый сервер баз данных может работать на определенном типе компьютера и сетевой ОС. К операционным системам серверов относятся: DOS 5/0, XENIX, UNIX, Windows NT, Os/2 и др. В настоящее время наиболее часто используются следующие серверы: SQL-server, ORACLE-server, SQLBASE- server и др.

Серверы баз данных рассчитаны на поддержку большого числа различных типов приложений. Для реализации интерфейса с сервером базы данных можно использовать объектно-ориентированные средства, электронные таблицы, текстовые процессоры, графические пакеты, настольные издательства и другие информационные технологии.

Вопросы для самоконтроля

1.     В чем заключается распределенная обработка данных?

2.     В чем сущность распределенной базы данных?

3.     Какие возможности предоставляет распределенная обработка данных?

4.     Назовите способы распределения данных.

5.     Перечислите виды информационных технологий распределенной обработки данных.


Содержание раздела