Базы данных общего пользования

Дата публикации или обновления 23.02.2024

Разработка баз данных общего пользования останется на долгие годы одним из основных направлений деятельности в области обработки данных. Данные все чаще рассматриваются как общие жизненно важные ресурсы, которые должны быть организованы так, чтобы ценность их была по возможности максимальной. Вместе с потребностями в базах данных в различных организациях непрерывно возрастает число требований на технические и программные средства обслуживания баз данных, обеспечивающих накопление, ведение и выборку данных.

субд - технические и программные средства обслуживания баз данных, обеспечивающие накопление, ведение и выборку данных.

Объем массивов данных, которые можно обрабатывать в ЭВМ, возрастает с головокружительной быстротой. Темпы увеличения объема памяти ЭВМ больше, чем темпы увеличения размеров или мощностей любых других компонентов в развивающейся области обработки данных. Чем больше данных может быть обработано в ЭВМ, тем больше потенциальные возможности их использования. Во всех областях жизни и производства банки данных изменят характер деятельности человека. Историки будут рассматривать появление банков данных на ЭВМ и возможностей, связанных с ними, как шаг, изменивший природу эволюции общества и имеющий, возможно, большее значение, чем изобретение печатного станка.

Некоторые из наиболее впечатляющих историй об общем росте воспроизводства в большой степени применимы к росту потребностей в информации. Уже сейчас, когда мы приближаемся к созданию информационно-ориентированного общества, около 20% объема национального продукта США расходуется на накопление, обработку и распространение знаний и информации во всех возможных формах.

Большая часть этой информации еще находится вне ЭВМ. Однако стоимость запоминающих устройств уменьшается быстрее, чем стоимость прочих средств обработки данных. Скоро может оказаться, что хранить данные в файлах ЭВМ будет дешевле, чем на бумаге. В ЭВМ может храниться не только печатный текст. ЭВМ позволяет хранить также чертежи, данные в рукописной форме, фотографии, записи голоса и т. д.

Фактически любая форма информации, кроме информации об интимных связях между людьми, может храниться и передаваться в цифровом представлении.

Уменьшение стоимости хранения одного бита информации связано с увеличением объема хранимых данных.

По мере роста емкости памяти стоимость хранения одного бита информации уменьшается. Если стоимость внешнего запоминающего устройства разделить на число битов, которые могут быть загружены на эти внешние устройства из библиотеки дисков или магнитных лент, то удельная стоимость одного бита памяти станет еще меньше.

Новые методы хранения информации, используемые в настоящее время, позволяют предположить, что экспоненциальный рост емкости памяти будет продолжаться в течение одного-двух десятилетий, если мы сможем найти соответствующие области использования таких есъемов памяти; даже трудно себе представить, какое влияние этот факт окажет на конструирование баз данных, на требования к программному обеспечению и на то, как будут использованы данные в промышленности.

В ближайшее время, по-видимому, уже появятся запоминающие устройства, построенные на одном из двух следующих принципов: первый — создание электромеханических устройств с существенно большим объемом хранимой информации, чем диски, но с более длительным временем доступа; второй — использование интегральной полупроводниковой технологии, позволяющей получать микросекундное время доступа, но за счет уменьшения объемов хранимой информации по сравнению с дисками. Емкость дисков, возможно, также увеличится. В более отдаленном будущем (например, лет через семь) появится ряд новых физических средств, разрабатываемых в настоящее время в исследовательских лабораториях, которые приведут к замене дисков новыми быстродействующими устройствами большой емкости. В течение следующих 10 лет эти новые устройства, вероятно, найдут широкое применение, что существенно снизит стоимость хранения данных.

Анализируя существующие методы, можно предположить, что в оперативных базах данных будут использоваться два или три уровня памяти: интегральные схемы с микросекундным временем доступа; запоминающие устройства на цилиндрических магнитных доменах с миллисекундным временем доступа и электромеханические устройства, время доступа которых лежит в диапазоне долей секунды до нескольких секунд. При использовании двух, трех или четырех уровней физическая организация памяти усложняется. В ней, по-видимому, будет использоваться механизм перемещения страниц для передачи данных между различными уровнями памяти. Память на интегральных схемах предоставляет возможность организации ассоциативной памяти и параллельного поиска. Обе эти организации предъявляют требования к методам управления памятью, которые не реализуются существующим программным обеспечением.

Объем хранимых данных и сложность их организации резко возрастают. Внешняя память объемом в 1 триллион битов (10 в 12 степени бит), непосредственно управляемая ЭВМ, уже существует. В ближайшие несколько лет память такого объема станет широко распространенной и можно ожидать появления памяти, объем которой в 10 раз превысит эту величину.

Для использования огромных объемов хранимой информации, помимо самой памяти, потребуются еще дополнительные системные устройства. Это — средства передачи данных, обеспечивающие возможность доступа к базе данных с удаленных абонентских пунктов, где эти данные используются, и средства обеспечения диалога человек - ЭВМ, которые позволяют пользователю вводить запросы, читать файлы, модифицировать хранимые данные, добавлять новые данные или принимать решения на основании хранимых данных. Создание этих систем является настолько же сложным, как и разработка самих баз данных. В настоящей книге рассматривается только организация данных, а создание средств передачи данных и разработка диалоговых систем рассмотрены в других книгах автора.

Во всех трех областях разработчик сталкивается с множеством сложных альтернатив. Чем больше альтернатив он сможет рассмотреть, тем больше вероятность, что ему удастся обеспечить оптимальную разработку. Многие недостатки существующих систем, работающих с базами данных (а таких недостатков немало), обусловлены тем, что разработчик сумел рассмотреть только часть возможных альтернатив. Большинство системных аналитиков имеет ограниченный объем знаний, и поэтому иногда они в первую очередь используют те методы, которыми владеют в совершенстве, и исключают другие методы, использование которых, возможно, могло бы дать лучшие результаты.

При разработке баз данных следует уделить особое внимание тому, Чтобы данные, хранящиеся в них, можно было широко использовать й различного рода приложениях и чтобы способы использования данных можно было легко и быстро изменять. До появления баз данных на вычислительных системах было чрезвычайно трудно изменить способ использования данных. Различные программисты по-разному представляли данные и постоянно стремились их модифицировать по мере возникновения новых задач.

Модификации, однако, вызывали цепочку изменений существующих программ, и, следовательно, их выполнение обходилось дорого. Поэтому при обработке информации стремились сохранить существующие структуры данных.

Для обеспечения гибкости использования данных, что необходимо для их эффективного применения в экономических системах, важными являются два аспекта разработки баз данных. Во-первых, данные должны быть независимы от программ, использующих их, так, чтобы эти данные могли добавляться или перестраиваться без изменения программ.

Во-вторых, должна быть обеспечена возможность запрашивать и отыскивать информацию в базе данных без трудоемкого написания программ на обычном языке программирования. Для этого используется язык запросов баз данных.

Разработка баз данных становится все более трудоемким процессом, особенно если ставится задача оптимизации. Программное обеспечение становится все более сложным, и его возможности часто не понимаются, не используются или используются неверно.

Существует несколько способов создания структур данных, и все они имеют достоинства и недостатки. Различные данные имеют различные характеристики, которые могут влиять на организацию данных. Кроме того, различные пользователи могут иметь совершенно разные потребности. Это часто приводит к тому, что ни одна организация данных не может полностью удовлетворить все требования (по крайней мере, на данном этапе). Поэтому разработчик должен искать и находить компромиссные решения.

Если учесть уменьшение стоимости хранения данных и возрастающие возможности систем передачи данных, становится ясно, что банки данных будут играть важную роль в развитии производства. Идентификация всех элементов данных, необходимых для работы предприятия, и определение того, где и как лучше записывать и хранить данные', являются грандиозной задачей. В настоящее время данные, используемые в организации, отличаются большой избыточностью, а часто одни и те же элементы данных определяются по-разному различными группами специалистов. Вследствие этого при установке ЭВМ на таких предприятиях часто выясняется, что существуют некоторые не замеченные ранее неясности, а используемые методы являются неточными. Устранение неточностей в определении и использовании данных должно вестись совместно с разработкой и объединением баз данных. Это является одной из основных задач в области разработки систем управления базами данных в ближайшее время.

На предприятиях и в учреждениях должны создаваться справочники данных, определяющие все элементы используемых данных. Определения должны быть согласованы между подразделениями предприятия. При этом для хранения огромного объема данных будет использовано множество различных способов организации элементов данных.

При разработке существующих систем часто принимались недальновидные решения относительно конструкции баз данных. Конечно, во многих ситуациях простые проектные решения невозможны из-за того, что существуют сложные взаимосвязи между различными аспектами разработки, например между использованием памяти и использованием машинного времени, между временем ответа и сложностью структуры данных, между разработкой, облегчающей выполнение непредвиденных запросов, и разработкой для четко определенной схемы функционирования.

Взаимосвязи, зависящие от психологии пользователя, являются субъективными. Такие вопросы может решить только системный аналитик, имеющий опыт в искусстве разработки диалога человек — ЭВМ и плюс ко всему, вероятно, имеющий достаточно широкий кругозор.

При проектировании систем управления базами данных имеется множество тесно связанных вопросов и большое число методов, которые можно использовать для решения этих вопросов; причем методов так много, что часто при разработке системы некоторые наиболее ценные из них не используются, в результате чего ряд жизненно важных вопросов остается нерешенным. Цель данной книги — познакомить читателя со многими альтернативами, возможными при организации баз данных, и взаимосвязями между ними.

В ближайшем будущем появятся новые запоминающие устройства, новые средства программного обеспечения и новые типы баз данных.

Мартин Дж. Организация баз данных в вычислительных системах. Москва. Издательство «Мир». 1980 г.

В начало



Как вылечить псориаз, витилиго, нейродермит, экзему, остановить выпадение волос