Хранение информации. Структура базовой информационной технологии

Хранение информации - это способ распространения информации в пространстве и времени. Способ хранения информации зависит от ее носителя (книга - библиотека, картина - музей, фотография - альбом). Способы хранения информации Этот процесс такой же древний, как и жизнь человеческой цивилизации. Уже в древности человек столкнулся с необходимостью хранения информации: зарубки на деревьях, чтобы не заблудиться во время охоты; счет предметов с помощью камешков, узелков; изображение животных и эпизодов охоты на стенах пещер. С рождением письменности возникло специальное средство фиксирования и распространения мысли в пространстве и во времени. Родилась документированная информация - рукописи и рукописные книги, появились своеобразные информационно-накопительные центры - древние библиотеки и архивы. Постепенно письменный документ стал и орудием управления (указы, приказы, законы). Вторым информационным скачком явилось книгопечатание. С его возникновением наибольший объем информации стал храниться в различных печатных изданиях, и для ее получения человек обращается в места их хранения (библиотеки, архивы и т.д.). В жизни человека процесс длительного хранения информации играет большую роль и подвергается постоянному совершенствованию. Когда объем накапливаемой информации возрастает настолько, что ее становится просто невозможно хранить в памяти, человек начинает прибегать к помощи различного рода записных книжек, указателей и т.д. Различная информация требует разного времени хранения:

    проездной билет надо хранить только в течение поездки;

    программу телевидения - текущую неделю;

    школьный дневник - учебный год;

    аттестат зрелости - до конца жизни;

    исторические документы - несколько столетий.

ЭВМ предназначена для компактного хранения информации с возможностью быстрого доступа к ней. Хранение очень больших объемов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме. Информационная система - это хранилище информации, снабженное процедурами ввода, поиска и размещения и выдачи информации. Наличие таких процедур - главная особенность информационных систем, отличающих их от простых скоплений информационных материалов. Например, личная библиотека, в которой может ориентироваться только ее владелец, информационной системой не является. В публичных же библиотеках порядок размещения книг всегда строго определенный. Поэтому поиск и выдача книг, а также размещение новых поступлений представляют собой стандартные, формализованные процедуры. Человек по-разному подходит к хранению информации. Все зависит от того сколько ее и как долго ее нужно хранить. Если информации немного ее можно запомнить в уме. Нетрудно запомнить имя своего друга и его фамилию. А если нужно запомнить его номер телефона и домашний адрес мы пользуемся записной книжкой. Когда информация запомнена (сохранена) ее называют данные. Для записи данных в книжку требуется больше времени, чем на то чтобы их запомнить. Востребовать данные из записной книжки или из тетрадки тоже не так просто как вспомнить, но если в голове информация не сохранилась, то и записная книжка и тетрадка оказываются более надежными источниками данных. Хранение информации Самые долговременные средства для хранения данных - это книги. В них данные хранятся сотни лет. Благодаря книгам информация распространяется не только в пространстве, но и во времени. Вы знаете что по древним рукописным книгам, созданным сотни и тысячи лет назад, можно приобретать знания и сегодня. Информация в книгах хранится столь долю потому что есть специальные организации которым поручено собирать все выходящие книги и надежно их хранить. Такие организации нам известны - это библиотеки и музеи. Любое знание, занесенное в книгу обязательно кем-то сохраняется для других поколений, для этого в каждом государстве есть специальные законы.

В памяти человека хранится информация обо всём, что он видел, слышал, чувствовал или испытывал. Люди хранят информацию на разных носителях и для хранения информации создают библиотеки и медиатеки. Зачем всё это? Хранение информации - это одно из действий с информацией, необходимое, прежде всего, для обеспечения жизнедеятельности и безопасности человека. Обратимся к истории. Давным-давно человек не умел добывать огонь и пользоваться им. Когда во время летней засухи возникали лесные пожары, люди обратили внимание на огонь и поняли, что огонь - это горячо! Если отойти подальше, то тепло, приятно. Люди сохранили в своей памяти информацию о свойствах огня и о том, как можно использовать огонь, чего при этом надо опасаться. Люди стали греться у огня, готовить на огне еду, обогревать и освещать огнём свой дом, но всегда при этом старались обеспечить свою безопасность. Только благодаря способности человека долго хранить в своей памяти информацию, его можно научить читать, писать и считать. Если бы у человека не было памяти, он не смог бы найти свой дом после прогулки, свои вещи в доме, приготовить пищу. Он не знал бы имён своих родителей и друзей и многое-многое другое. Информация, которая хранится в памяти отдельного человека, недоступна другим людям. Если то, что знает человек, он выразит каким-либо образом: звуками устной речи, письменно или рисунком, информацией смогут воспользоваться другие люди. Представленная на носителе информация уже не «связана» с памятью отдельного, конкретного человека. Сохранённой, то есть представленной на носителе, информацией может пользоваться любой человек. Важно, что представленную на носителе инфор­мацию можно хранить и передавать другим людям. Как тем, кто находится далеко, так и тем, кто будет жить после нас. Информацию, представленную на носителе рисунком, числами или текстом, можно долго хранить и передавать на большие расстояния. В каждом доме есть фотоальбом, в котором хра­нятся фотографии родных и близких людей. Тексты и рисунки сохраняют в записных книжках, книгах, журналах, дневниках. Про журнал, записную книжку, дневник или книгу можно сказать - это хранилище за­кодированной информации. Книги предназначены для длительного хранения информации. Книги хранят в библиотеках. В библиотеке обыч­но хранится много книг. Библиотеки бывают домаш­ние и школьные, городские и районные, детские и технические. Библиотека - это хранилище книг, то есть хранилище закодированной информации. В настоящее время люди научились хранить не только тексты и рисунки. Появились способы кодиро­вания и хранения звуковой и видеоинформации. Уже существуют книги, учебники, справочники, энциклопедии, которые изготовлены не из бумаги, а, напри­мер, в виде магнитных и лазерных дисков. Диски хранятся не в библиотеке, а в медиатеке. Медиатека - это хранилище электронных книг, справочников, энциклопедий, компьютерных игр, обучающих программ. Компьютер тоже хранит информацию в своей па­мяти. Закодировать и хранить в памяти компьютера в виде цифровых данных можно и звуки, и изображе­ния, и тексты, и числа, и видеофильмы. Во время работы компьютера информация хранится в его внутренней памяти. Прежде чем выклю­чить компьютер, следует сохранить информацию на дисках (во внешней памяти), иначе она пропадёт.

Главное, что мы должны понять и запомнить

1. Хранение информации - это одно из действий с информацией. 2. Человек хранит информацию в своей памяти для обеспечения своей жизнедеятельности и безопасности. Память человека обеспечивает его способность учиться и работать. 3. Книги предназначены для длительного хранения информации. 4. Компьютер - это очень удобный инструмент для хранения закодированной информации. 5. Закодировать и хранить в памяти компьютера можно и звуки, и изображения, и тексты, и числа, и видеофильмы.

Человек в своей памяти хранит информацию об окружающей действительности в виде различных образов: зрительных, звуковых, вкусовых и т.д. Для долговременного хранения информации, ее накопления и передачи из поколения в поколение используются материальные носители информации. Материальная природа носителей информации может быть различной:

    молекулы ДНК, которые хранят генетическую информацию;

    бумага, на которой хранятся тексты и изображения;

    магнитная лента, на которой хранится звуковая информация;

    микросхемы памяти,

    магнитные и лазерные диски, на которых хранятся программы и данные в компьютере и т.д.

Носители информации характеризуются информационной емкостью, т.е. количеством информации, которое они могут хранить. Наиболее информационно емкими являются молекулы ДНК, которые имеют очень малый размер и плотно упакованы. Это позволяет хранить огромное количество информации (до 10 21 бит в 1 см 3), что позволяет организму развиваться из одной единственной клетки, содержащей всю необходимую генетическую информацию. Современные микросхемы памяти позволяют хранить в 1 см 3 до 10 10 бит информации, однако это в 100 миллиардов раз меньше, чем в ДНК. Можно сказать, что современные технологии пока существенно проигрывают биологической эволюции. Однако, если сравнивать информационную емкость традиционных носителей информации (книг) и современных компьютерных носителей, то прогресс очевиден. На каждом гибком магнитном диске может храниться книга объемом около 600 страниц, а на жестком магнитном диске целая библиотека, включающая десятки тысяч книг.

Носитель информации - материальный объект, предназначенный для хранения информации.

Носители информации можно различать не только по материалу, из которого они изготовлены, но и по способу их изготовления (например, рукописные, машинописные и т.д.), по специфике предназначения (микрофотокопии; чертежи; книги для слепых, напечатанные шрифтом Брайля).

Если спилить дерево, то по кольцам на стволе можно определить, сколько ему лет, дождливым или засушливым был каждый год его жизни и многое другое. Значит, дерево хранит информацию обо всей своей жизни. Давным-давно, когда на Земле жили первобытные люди, возникла необходимость хранить различные сведения о способах охоты, земледелия. Для этого люди использовали рисунки, зарубки на палках, узелки на веревках. По этой информации мы и узнаем, как они жили. С появлением письменности человек стал хранить информацию на папирусе, глиняных табличках, берестяных свитках, бумаге. Современный человек для хранения информации использует фотопленку, киноленту, магнитные ленты и диски, лазерные диски и другие носители. Технические устройства и другие приспособления, на которых хранится информация, называются информационными носителями. Всем знаком информационный носитель – книга. Записная книжка, дневник, в который ученик записывает расписание уроков и домашние задания, - тоже информационные носители. Дверной косяк, на котором родители ежегодно отмечают рост своего ребенка, - тоже информационный носитель. Вы уже знаете, что иметь дело с хранением информации приходится очень часто, но информацию недостаточно просто сохранить, надо сделать так, чтобы потом, когда она понадобится, ее можно было быстро найти. Для этого люди придумали организацию хранения информации. Вот, например, вы решили сохранить адреса и телефоны одноклассников. Как лучше поступить? Правильно, нужно записать фамилии в записную книжку на странички, помеченные буквами – указателями в алфавитном порядке. Если хранить информацию в таком порядке, то очень быстро можно найти нужную фамилию, ведь алфавит мы хорошо знаем. Как найти нужное место в книге? Можно, конечно, просто перелистывать книгу страница за страницей, пока не найдется нужная страница, но этот способ займет много времени. Гораздо быстрее посмотреть оглавление. А какой способ использован для записи учеников в классном журнале? В расписании поездов указано, в какой город и в какое время уходит каждый поезд. В каком порядке надо расположить эту информацию, чтобы было удобно пассажиру? А как будет удобнее диспетчеру железнодорожного вокзала? В каком порядке располагаются слова в словаре? В телефонной книге названия учреждений тоже расположены в определенном порядке. В каком? Какие же существуют способы организации информации? Это таблицы, схемы, каталоги и др. Со схемами и таблицами вы уже работали на уроках. Посещая детскую библиотеку и читальный зал, видели библиотечные каталоги, в которых карточки расположены в алфавитном порядке. На карточки заносятся различные сведения, например: автор, название книги, год выпуска книги и др. Существуют и компьютерные электронные каталоги. Одну и ту же информацию можно представить различными способами

Информатика и ИКТ 10-11 класс Семакин, Информатика 10-11 класс Семакин, Хранение информации, Использование магнитных носителей информации, Использование оптических дисков и флэш-памяти

Из базового курса вам известно:
Человек хранит информацию в собственной памяти, а также в виде записей на различных внешних (по отношению к человеку) носителях: на камне, папирусе, бумаге, магнитных и оптических носителях и пр. Благодаря таким записям, информация передается не только в пространстве (от человека к человеку), но и во времени — из поколения в поколение.
Рассмотрим способы хранения информации более подробно.
Информация может храниться в различных видах: в виде записанных текстов, рисунков, схем, чертежей; фотографий, звукозаписей, кино- или видеозаписей. В каждом случае применяются свои носители.
Носитель — это материальная среда, используемая для записи и хранения информации.
Практически носителем информации может быть любой материальный объект. Информацию можно сохранять на камне, дереве, стекле, ткани, песке, теле человека и т. д. Здесь мы не станем обсуждать различные исторические и экзотические варианты носителей. Ограничимся современными средствами хранения информации, имеющими массовое применение.
Использование бумажных носителей информации
Носителем, имеющим наиболее массовое употребление, до сих пор остается бумага. Изобретенная во II веке н. э. в Китае, бумага служит людям уже 19 столетий.
Для сопоставления объемов информации на разных носителях будем пользоваться единицей — байтом, считая, что один знак текста «весит» 1 байт . Нетрудно подсчитать информационный объем книги, содержащей 300 страниц с размером текста на странице примерно 2000 символов. Текст такой книги имеет объем примерно 600 000 байтов, или 586 Кб. Средняя школьная библиотека, фонд которой составляют 5000 томов, имеет информационный объем приблизительно 2861 Мб = 2,8 Гб.
Что касается долговечности хранения документов, книг и прочей бумажной продукции, то она очень сильно зависит от качества бумаги, красителей, используемых при записи текста, условий хранения. Интересно, что до середины XIX века (с этого времени для производства бумаги начали использовать древесину) бумага делалась из хлопка и текстильных отходов — тряпья. Чернилами служили натуральные красители. Качество рукописных документов того времени было довольно высоким, и они могли храниться тысячи лет. С переходом на древесную основу, с распространением машинописи и средств копирования, с началом использования синтетических красителей срок хранения печатных документов снизился до 200-300 лет.
На первых компьютерах бумажные носители использовались для цифрового представления вводимых данных. Это были перфокарты: картонные карточки с отверстиями, хранящие двоичный код вводимой информации. На некоторых типах ЭВМ для тех же целей применялась перфорированная бумажная лента.
Использование магнитных носителей информации
В XIX веке была изобретена магнитная запись . Первоначально она использовалась только для сохранения звука. Самым первым носителем магнитной записи была стальная проволока диаметром до 1 мм. В начале XX столетия для этих целей использовалась также стальная катаная лента. Тогда же (в 1906 г.) был выдан и первый патент на магнитный диск . Качественные характеристики всех этих носителей были весьма низкими. Достаточно сказать, что для производства 14-часовой магнитной записи устных докладов на Международном конгрессе в Копенгагене в 1908 г. потребовалось 2500 км, или около 100 кг проволоки.
В 20-х годах XX века появляется магнитная лента сначала на бумажной, а позднее — на синтетической (лавсановой) основе, на поверхность которой наносится тонкий слой ферромагнитного порошка. Во второй половине XX века на магнитную ленту научились записывать изображение, появляются видеокамеры, видеомагнитофоны.
На ЭВМ первого и второго поколений магнитная лента использовалась как единственный вид сменного носителя для устройств внешней памяти. Любая компьютерная информация на любом носителе хранится в двоичном (цифровом) виде. Поэтому независимо от вида информации: текст это, или изображение, или звук — ее объем можно измерить в битах и байтах. На одну катушку с магнитной лентой, использовавшейся в лентопротяжных устройствах первых ЭВМ, помещалось приблизительно 500 Кб информации.
С начала 1960-х годов в употребление входят компьютерные магнитные диски: алюминиевые или пластмассовые диски, покрытые тонким магнитным порошковым слоем толщиной в несколько микрон. Информация на диске располагается по круговым концентрическим дорожкам. Магнитные диски бывают жесткими и гибкими, сменными и встроенными в дисковод компьютера.
Последние традиционно называют винчестерскими дисками.
Винчестер компьютера — это пакет магнитных дисков, надетых на общую ось. Информационная емкость современных винчестерских дисков измеряется в гигабайтах (десятки и сотни Гб). Наиболее распространенный тип гибкого диска диаметром 3,5 дюйма вмещает около 1,4 Мб данных. Гибкие диски в настоящее время выходят из употребления.
В банковской системе большое распространение получили пластиковые карты. На них тоже используется магнитный принцип записи информации, с которой работают банкоматы, кассовые аппараты, связанные с информационной банковской системой.
Использование оптических дисков и флэш-памяти
Применение оптического, или лазерного, способа записи информации начинается в 1980-х годах. Его появление связано с изобретением квантового генератора — лазера, источника очень тонкого (толщина порядка микрона) луча высокой энергии. Луч способен выжигать на поверхности плавкого материала двоичный код данных с очень высокой плотностью. Считывание происходит в результате отражения от такой « перфорированной» поверхности лазерного луча с меньшей энергией («холодного» луча). Благодаря высокой плотности записи, оптические диски имеют гораздо больший информационный объем, чем однодисковые магнитные носители. Информационная емкость оптического диска составляет от 190 Мб до 700 Мб. Оптические диски называются компакт-дисками (CD).
Во второй половине 1990-х годов появились цифровые универсальные видеодиски DVD (Digital Versatile Disk) с большой емкостью, измеряемой в гигабайтах (до 17 Гб). Увеличение их емкости по сравнению с CD-дисками связано с использованием лазерного луча меньшего диаметра, а также двухслойной и двусторонней записи. Вспомните пример со школьной библиотекой. Весь ее книжный фонд можно разместить на одном DVD.
В настоящее время оптические диски (CD и DVD) являются наиболее надежными материальными носителями информации, записанной цифровым способом. Эти типы носителей бывают как однократно записываемыми — пригодными только для чтения, так и перезаписываемыми — пригодными для чтения и записи.
В последнее время появилось множество мобильных цифровых устройств: цифровые фото- и видеокамеры, МРЗ-плееры, карманные компьютеры, мобильные телефоны, устройства для чтения электронных книг, GPS-навигаторы и др. Все эти устройства нуждаются в переносных носителях информации. Но поскольку все мобильные устройства довольно миниатюрные, то и к носителям информации для них предъявляются особые требования. Они должны быть компактными, обладать низким энергопотреблением при работе, быть энергонезависимыми при хранении, иметь большую емкость, высокие скорости записи и чтения, долгий срок службы. Всем этим требованиям удовлетворяют флэш-карты памяти. Информационный объем флэш-карты может составлять несколько гигабайтов.
В качестве внешнего носителя для компьютера широкое распространение получили так называемые флэш-брелоки (их называют в просторечии «флэшки»), выпуск которых начался в 2001 году. Большой объем информации, компактность, высокая скорость чтения/записи, удобство в использовании — основные достоинства этих устройств. Флэш-брелок подключается к USB-порту компьютера и позволяет скачивать данные со скоростью около 10 Мб в секунду.
В последние годы активно ведутся работы по созданию еще более компактных носителей информации с использованием так называемых нанотехнологий, работающих на уровне атомов и молекул вещества. В результате один компакт- диск , изготовленный по нанотехнологии, сможет заменить тысячи лазерных дисков. По предположениям экспертов приблизительно через 20 лет плотность хранения информации возрастет до такой степени, что на носителе объемом примерно с кубический сантиметр можно будет записать каждую секунду человеческой жизни.
Система основных понятий

Хранение информации

Носители информации

Нецифровые

Цифровые (компьютерные)

Исторические:

пергамент,

шелк и др.

Современные:

Магнитные

Оптические

Флэш-носители

Ленты Диски Карты

Флэш- Флэш- карты брелоки

Факторы качества носителей

Вместимость - плотность хранения дан-ных, объем данных

Надежность хранения - максимальное время сохранности дан-ных, зависимость от условий хранения

Наибольшей вместимостью и надежностью на сегодня обладают оптические носители CD и DVD

Перспективные виды носителей:

носители на базе нанотехнологий


Хранение информации

Наименование параметра Значение
Тема статьи: Хранение информации
Рубрика (тематическая категория) Технологии

Хранение и накопление являются одними из базовых действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. Сегодня определяющим направлением реализации этой операции является концепция базы данных и склада (хранилища) данных.

База данных должна быть определœена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователœей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных - система, представляющая определœенные услуги по хранению и поиску данных определœенной группе пользователœей по определœенной тематике.

Система баз данных - совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователœей.

Хранилище данных (ХД, используют также термины Data Warehouse, ʼʼсклад данныхʼʼ, ʼʼинформационное хранилищеʼʼ) - это база, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых - автоматическое; доступ к ХД осуществляется на базе многомерного куба или гиперкуба.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных - множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.

Еще одним важным направлением развития баз данных являются репозитарии. Репозитарий, в упрощенном виде, можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозитариев проистекает из словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.

Каждый из участников действия (пользователь, группа пользователœей, ʼʼфизическая памятьʼʼ) имеет свое представление об информации

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое).

Концептуальный уровень связан с частным представлением данных группы пользователœей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделœей: модель ʼʼсущность-связьʼʼ (ER-модель, модель Чена), бинарные и инфологические модели, семантические сети.

Логический уровень является обобщенным представлением данных всœех пользователœей в абстрактной форме. Используются три вида моделœей: иерархические, сетевые и реляционные.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи ʼʼмногие к одномуʼʼ и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), в ее базе лежит математическое понятие теоретико-множественного отношения, она базируется на реляционной алгебре и теории отношений.

Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным методом управления. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.

По наиболее характерным признакам БД можно классифицировать следующим образом:

по способу хранения информации:

‣‣‣ интегрированные;

‣‣‣ распределœенные;

по типу пользователя

‣‣‣ монопользовательские;

‣‣‣ многопользовательские;

по характеру использования данных:

‣‣‣ прикладные;

‣‣‣ предметные.

Сегодня при проектировании БД используют два подхода. Первый из них основан на стабильности данных, что обеспечивает наибольшую гибкость и адаптируемость к используемым приложениям. Применение такого подхода целœесообразно в тех случаях, когда не предъявляются жесткие требования к эффективности функционирования (объему памяти и продолжительности поиска), существует большое число разнообразных задач с изменяемыми и непредсказуемыми запросами.

Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эффективности функционирования, особенно это касается быстродействия.

Другим важным аспектом проектирования БД является проблема интеграции и распределœения данных. Господствовавшая до недавнего времени концепция интеграции данных при резком увеличении их объёма, оказалась несостоятельной. Этот факт, а также увеличение объёмов памяти внешних запоминающих устройств при их удешевлении, широкое внедрение сетей передачи данных способствовало внедрению распределœенных БД. Распределœение данных по месту их использования может осуществляться различными способами:

1.Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи данных. Модификация данных контролируется централизованно.

2.Подмножество данных. Группы данных, совместимые с исходной базой данных, хранятся отдельно для местной обработки.

3.Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень.

4.Секционированные данные. На различных объектах используются одинаковые структуры, но хранятся разные данные.

5.Данные с отдельной подсхемой. На различных объектах используются различные структуры данных, объединяемые в интегрированную систему.

6.Несовместимые данные. Независимые базы данных, спроектированные без координации, требующие объединœения.

Важное влияние на процесс создания БД оказывает внутреннее содержание информации. Существует два направления:

‣‣‣ прикладные БД, ориентированные на конкретные приложения, к примеру, должна быть создана БД для учета и контроля поступления материалов;

‣‣‣ предметные БД, ориентированные на конкретный класс данных, к примеру, предметная БД ʼʼМатериалыʼʼ, которая должна быть использована для различных приложений.

Конкретная реализация системы баз данных с одной стороны определяется спецификой данных предметной области, отраженной в концептуальной модели, а с другой стороны типом конкретной СУБД (МБД), устанавливающей логическую и физическую организацию.

Для работы с БД используется специальный обобщенный инструментарий в виде СУБД (МБД), предназначенный для управления БД и обеспечения интерфейса пользователя.

Основные стандарты СУБД:

‣‣‣ независимость данных на концептуальном, логическом, физическом уровнях;

‣‣‣ универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);

‣‣‣ совместимость, неизбыточность;

‣‣‣ безопасность и целостность данных;

‣‣‣ актуальность и управляемость.

Существуют два базовых направления реализации СУБД: программное и аппаратное.

Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением конкретной ОС и выполняет следующие функции:

· описание данных на концептуальном и логическом уровнях;

· загрузку данных;

· хранение данных;

· поиск и ответ на запрос (транзакцию);

· внесение изменений;

· обеспечение безопасности и целостности.

· обеспечивает пользователя следующими языковыми средствами:

o языком описания данных (ЯОД);

o языком манипулирования данными (ЯМД);

o прикладным (встроенным) языком данных (ПЯД, ВЯД).

Аппаратная реализация предусматривает использование так называемых машин баз данных (МБД). Их появление вызвано возросшими объёмами информации и требованиями к скорости доступа. Слово ʼʼмашинаʼʼ в терминœе МБД означает вспомогательный периферийный процессор.
Размещено на реф.рф
Термин ʼʼкомпьютер БДʼʼ - автономный процессор баз данных или процессор, поддерживающий СУБД.

Основные направления МБД:

‣‣‣ параллельная обработка;

‣‣‣ распределœенная логика;

‣‣‣ ассоциативные ЗУ;

‣‣‣ конвейерные ЗУ;

‣‣‣ фильтры данных и др.

Совокупность процедур проектирования БД можно объединить в четыре этапа. На этапе формулирования и анализа требований устанавливаются цели организации, определяются требования к БД. Эти требования документируются в форме, доступной конечному пользователю и проектировщику БД. Обычно при этом используется методика интервьюирования персонала различных уровней управления.

Этап концептуального проектирования состоит в описании и синтезе информационных требований пользователœей в первоначальный проект БД. Результатом этого этапа является высокоуровневое представление информационных требований пользователœей на базе различных подходов.

В процессе логического проектирования высокоуровневое представление данных преобразуется в структуре используемой СУБД. Полученная логическая структура БД должна быть оценена количественно с помощью различных характеристик (число обращений к логическим записям, объём данных в каждом приложении, общий объём данных и т.д.). На базе этих оценок логическая структура должна быть усовершенствована с целью достижения большей эффективности.

На этапе физического проектирования решаются вопросы, связанные с производительностью системы, определяются структуры хранения данных и методы доступа.

Весь процесс проектирования БД является итеративным, при этом каждый этап воспринимается как совокупность итеративных процедур, в результате выполнения которых получают соответствующую модель.

Взаимодействие между этапами проектирования и словарной системой крайне важно рассматривать отдельно. Процедуры проектирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования.

Этап расчленения БД связан с разбиением ее на разделы и синтезом различных приложений на базе модели. Основными факторами, определяющими методику расчленения, являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использования приложения и его моделью.

Модели приложений бывают классифицированы следующим образом:

1. Приложения, использующие единственный файл.

2. Приложения, использующие несколько файлов, в том числе:

‣‣‣ допускающие независимую параллельную обработку;

‣‣‣ допускающие синхронизированную обработку.

Сложность реализации этапа размещения БД определяется многовариантностью. По этой причине на практике рекомендуется в первую очередь рассмотреть возможность использования определœенных допущений, упрощающих функции СУБД, к примеру, допустимость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др.
Размещено на реф.рф
Такие допущения оказывают большое влияние на выбор СУБД и рассматриваемую фазу проектирования.

Средства проектирования и оценочные критерии используются на всœех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становится инструментальным средством проектирования, практически не подверженным влиянию стиля проектирования.

Сегодня неопределœенность при выборе критериев является наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа альтернативных решений. При этом следует иметь в виду, что существует много признаков оптимальности, являющихся неизмеримыми, им трудно дать количественную оценку или представить их в виде целœевой функции. По этой причине оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в такие категории, представлены ниже.

Количественные критерии: время, крайне важно е для ответа на вопрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию.

Качественные критерии: гибкость, адаптивность, доступность для новых пользователœей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределœения и расширения.

Трудность в оценке проектных решений связана также с различной чувствительностью и временем действия критериев. К примеру, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимым изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Предназначение склада данных - информационная поддержка принятия решений, а не оперативная обработка данных. Потому база данных и склад данных не являются одинаковыми понятиями.

Хранение информации - понятие и виды. Классификация и особенности категории "Хранение информации" 2017, 2018.

Информатика, кибернетика и программирование

Хранение информации данных не является самостоятельной фазой в информационном процессе а входит в состав фазы обработки. Различают структурированные данные в которых отражаются отдельные факты предметной области это основная форма представления данных в СУБД и неструктурированные произвольные по форме включающие и тексты и графику и прочие данные. Эта форма представления данных широко используется например в Интернеттехнологиях а сами данные предоставляются пользователю в виде отклика поисковыми системами. Организация того или...

PAGE \* MERGEFORMAT 3

Вопрос 2 . Хранение информации.

Хранение информации (данных) не является самостоятельной фазой в информационном процессе, а входит в состав фазы обработки. Однако, в силу важности организации хранения, данный материал вынесен в отдельный раздел.

Различают структурированные данные, в которых отражаются отдельные факты предметной области (это основная форма представления данных в СУБД), и неструктурированные, произвольные по форме, включающие и тексты, и графику, и прочие данные. Эта форма представления данных широко используется, например, в Интернет-технологиях, а сами данные предоставляются пользователю в виде отклика поисковыми системами.

Организация того или иного вида хранения данных (структурированных или неструктурированных) связана с обеспечением доступа к самим данным. Под доступом понимается возможность выделения элемента данных (или множества элементов) среди других элементов по каким-либо признакам с целью выполнения некоторых действий над элементом. При этом под элементом понимается как запись файла (в случае структурированных данных), так и сам файл (в случае неструктурированных данных).

Для данных любого вида доступ осуществляется с помощью специальных данных, которые называются ключевыми (ключами ). Для структурированных данных такие ключи входят в состав записей файлов в качестве отдельных полей записей. Для неструктурированных поисковые слова или выражения входят, как правило, в искомый текст. С помощью ключей выполняется идентификация требуемых элементов в информационном массиве (массиве хранения данных).

Дальнейшее изложение фазы хранения информации относится к структурированным данным.

Модели структурированных данных и технологии их обработки основаны на одном из трех способов организации хранения данных: в виде линейного списка (или табличном), иерархическом (или древовидном), сетевом .

Хранение информации – это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.

Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.

Основное содержание процесса хранения и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных в активном состоянии.

В результате реализации такого алгоритма, документ, независимо от формы представления, поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где он помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.

Этап хранения информации может быть представлен на следующих уровнях:

Внешнем;

Концептуальном, (логическом);

Внутреннем;

Физическом.

Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе реализации их хранения.

Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).

Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.

Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.

Способы организации хранения информации связаны с ее поиском – операцией, предполагающей извлечение хранимой информации.

Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Для этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней. Эти методы применяются для работы с файлами, графическими базами данных и т.д.

Рис. 1 Алгоритм процесса подготовки информации к хранению

Маркер – метка на носителе информации, обозначающая начало или конец данных либо их части (блока).

В современных носителях информации используются маркеры:

Адреса (адресный маркер) – код или физическая метка на дорожке диска, указывающие на начало адреса сектора;

Группы – маркер, указывающий начало или конец группы данных;

Дорожки (начала оборота) – отверстие на нижнем диске пакета магнитных дисков, указывающие физическое начало каждой дорожки пакета.

Защиты – прямоугольный вырез на носителе (картонном пакете, конверте, магнитном диске), разрешающий выполнение любых операций над данными: запись, чтение, обновление, удаление и др.;

Конца файла – метка, используемая для указания окончания считывания последней записи файла;

Ленты (ленточный маркер) – управляющая запись или физическая метка на магнитной ленте, обозначающая признак начала или конца блока данных или файла;

Сегмента – специальная метка, записываемая на магнитной ленте для отделения одного сегмента набора данных от другого сегмента.

Хранение информации в ЭВМ связано как с процессом ее арифметической обработки, так и с принципами организации информационных массивов, поиска, обновления, представления информации и др.

Важным этапом автоматизированного этапа хранения является организация информационных массивов.

Массив – упорядоченное множество данных.

Информационный массив – система хранения информации, включающая представление данных и связей между ними, т.е. принципы их организации.

Хранение информации осуществляется на специальных носителях. Исторически наиболее распространенным носителем информации была бумага, которая, однако, непригодна в обычных (не специальных) условиях для длительного хранения информации. Для ЭВТ по материалу изготовления различают следующие машинные носители: бумажные, металлические, пластмассовые, комбинированные и др.

По принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.

По методу считывания различают контактные, магнитные, электрические, оптические. Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе. Выделяют носители прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается следующими параметрами: временем доступа, емкостью памяти и плотностью записи.

Таким образом можно заключить, что хранение информации представляет процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.

Хранение информации

Информация, закодированная с помощью естественных и формальных языков, а также информация в форме зрительных и звуковых образов хранится в памяти человека. Однако для долговременного хранения информации, ее накопления и передачи из поколения в поколение используются носители информации .

Материальная природа носителей информации может быть различной: молекулы ДНК, которые хранят генетическую информацию; бумага, на которой хранятся тексты и изображения; магнитная лента, на которой хранится звуковая информация; фото- и кинопленки, на которых хранится графическая информация; микросхемы памяти, магнитные и лазерные диски, на которых хранятся программы и данные в компьютере, и так далее.

По оценкам специалистов, объем информации, фиксируемой на различных носителях, превышает один эксабайт в год (10 18 байт/год). Примерно 80% всей этой информации хранится в цифровой форме на магнитных и оптических носителях и только 20% - на аналоговых носителях (бумага, магнитные ленты, фото- и кинопленки). Если всю записанную в 2000 году информацию распределить на всех жителей планеты, то на каждого человека придется по 250 Мбайт, а для ее хранения потребуется 85 миллионов жестких магнитных дисков по 20 Гбайт.

Информационная емкость носителей информации. Носители информации характеризуются информационной емкостью, то есть количеством информации, которое они могут хранить. Наиболее информационно емкими являются молекулы ДНК, которые имеют очень малый размер и плотно упакованы. Это позволяет хранить огромное количество информации (до 10 21 битов в 1 см 3 ), что дает возможность организму развиваться из одной-единственной клетки, содержащей всю необходимую генетическую информацию.

Современные микросхемы памяти позволяют хранить в 1 см 3 до 10 10 битов информации, однако это в 100 миллиардов раз меньше, чем в ДНК. Можно сказать, что современные технологии пока существенно проигрывают биологической эволюции.

Однако если сравнивать информационную емкость традиционных носителей информации (книг) и современных компьютерных носителей, то прогресс очевиден. На каждом гибком магнитном диске может храниться книга объемом около 600 страниц, а на жестком магнитном диске или DVD - целая библиотека, включающая десятки тысяч книг.

Надежность и долговременность хранения информации. Большое значение имеет надежность и долговременность хранения информации. Большую устойчивость к возможным повреждениям имеют молекулы ДНК, так как существует механизм обнаружения повреждений их структуры (мутаций) и самовосстановления.

Надежность (устойчивость к повреждениям) достаточно высока у аналоговых носителей, повреждение которых приводит к потери информации только на поврежденном участке. Поврежденная часть фотографии не лишает возможности видеть оставшуюся часть, повреждение участка магнитной ленты приводит лишь к временному пропаданию звука и так далее.

Цифровые носители гораздо более чувствительны к повреждениям, даже утеря одного бита данных на магнитном или оптическом диске может привести к невозможности считать файл, то есть к потере большого объема данных. Именно поэтому необходимо соблюдать правила эксплуатации и хранения цифровых носителей информации.

Наиболее долговременным носителем информации является молекула ДНК, которая в течение десятков тысяч лет (человек) и миллионов лет (некоторые живые организмы), сохраняет генетическую информацию данного вида.

Аналоговые носители способны сохранять информацию в течение тысяч лет (египетские папирусы и шумерские глиняные таблички), сотен лет (бумага) и десятков лет (магнитные ленты, фото- и кинопленки).

Цифровые носители появились сравнительно недавно и поэтому об их долговременности можно судить только по оценкам специалистов. По экспертным оценкам, при правильном хранении оптические носители способны хранить информацию сотни лет, а магнитные - десятки лет.

Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных, склада (хранилища) данных.

База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных - система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.

Система баз данных - совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (ХД - используют также термины Data Warehouse, «склад данных», «информационное хранилище») - это база, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых - автоматическое; доступ к ХД осуществляется на основе многомерного куба или гиперкуба.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных - множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.

Еще одним важным направлением развития баз данных являются репозитарии. Репозитарий, в упрощенном виде, можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозитариев проистекает из словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.

Каждый из участников действия (пользователь, группа пользователей, «физическая память») имеет свое представление об информации

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое).

Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность-связь», ER-модель, модель Чена), бинарные и инфологические модели, семантические сети).

Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются три вида моделей: иерархические, сетевые и реляционные.

Структура базовой информационной технологии.

Определим структуру и состав типовой ИТ. Мы будем называть типовую ИТ базовой , если она ориентирована на определенную область применения. Базовая ИТ создает модели, методы средства решения задач. Базовая ИТ создается на основе базовых (типовых) аппаратно-программных средств. Базовая ИТ подчинена основной цели - решению функциональных задач в своей предметной области (задачи управления, проектирования, научного эксперимента, испытания и т. д.).

На вход базовой ИТ как системы поступает комплекс решаемых задач, для которых должны быть найдены типовые решения с помощью методов и средств, присущих именно ИТ. Рассмотрим использование базовой ИТ на концептуальном, логическом и физическом уровнях.

Концептуальный уровень базовой ИТ - задается идеология автоматизированного решения задач. Типовая последовательность решения задач может быть представлена в виде алгоритма.

Рис. 2 . Концептуальная модель базовой ИТ.

Начальный этап - постановка задачи (ПЗ). Если эта задача автоматизированного управления, то она представляет собой совокупность взаимосвязанных алгоритмов, которые обеспечивают управление. ПЗ - содержательное описание задачи: целевое назначение задачи, экономико-математическая модель и метод ее решения, функциональная и информационная взаимосвязь с другими задачами. Оформляется документально в методических материалах «Постановка задачи и алгоритм решения». На этом этапе очень важна корректность описания с точки зрения критериев.

Следующий этап - формализация задачи (ФЗ). Разрабатывается математическая модель.

Если математическая модель установлена, следующий этап - алгоритмизация задачи (АЗ). Алгоритм - процесс преобразования исходных данных в искомое результат за конечное число шагов.

Реализация алгоритма на основе конкретных вычислительных средств осуществляется на этапе программирования задачи - ПРЗ. Это объемная задача, но она осуществляется как правило на типовых технологиях программирования.

При наличии программы осуществляется РЗ - решение задач - получение конкретных результатов для входных данных и принятых ограничений.

Этап АР - анализ решения. При анализе решения можно уточнить модель формализации задач.

Наиболее сложными, творческими и объемными являются этапы постановки задачи и ее формализации. Понятие первоначальной задачи - это глубокое понимание процессов в предметной области.

В условиях базовой ИТ глобальная задача - это разработка модели предметной области (МПО).

При реализации ИТ часто встречаются с плохо формализуемыми задачами. Тут приходят на помощь экспертные системы. В основу ЭС закладываются знания лучших экспертов в предметной области. Разработчик ЭС собирает все известные способы формализации данной задачи. Пользователь - разработчик данной ИТ - получает варианты решения задач. Это процесс автоматизирования проектирования ИТ.

Логический уровень создания ИТ. Модели базовой ИТ

На логическом уровне устанавливают модели решения задачи и организации информационных процессов. Если известна общая модель управления некой АСУ, в которую будет внедряться базовая ИТ, мы можем представить взаимосвязь моделей базовой ИТ.

Цель базовой ИТ на логическом уровне - построение модели решаемой задачи и ее реализация на основе организации информационных процессов.

Рассмотрим взаимосвязь моделей базовой ИТ на схеме.

Рис. 3 . Логический уровень базовой ИТ. Модель организации информационных процессов.

Модель решения задачи в условиях выбранной базовой ИТ согласуется с моделью организации информационных процессов (МОИП). МОИП включает в себя МОД (модель обработки данных), МО (модель обмена данными), МУПД (модель управления данными), МНД(модель накопления данных), МПЗ (модель представления знаний). Каждая из этих моделей отражает определенные информационные процессы и содержит базы построения частных матмоделей конкретного информационного процесса.

Модель обмена - оценивает вероятностно-временные характеристики процесса обмена с учетом маршрутизации (М), коммутации (К) и передачи (П) информации. В качестве воздействий в этом процессе участвуют: входные (потоки сообщений); мешающие (потоки ошибок), и управляющие (потоки управления). На основании этой модели синтезируют систему обмена данными, то есть выбирают технологию сети, метод оптимальной коммутации, маршрутизации.

Модель накопления данных МНД. Определяет схему информационной базы СИБ, устанавливает логическую организацию информационных массивов ОИМ, задает физическое размещение информационных массивов РИМ.

Информационный массив - основное понятие, основной элемент внутримашинного информационного обеспечения. ИМ - совокупность данных по группе однородных объектов, содержащих одинаковый набор сведений. ИМ могут включать информацию:

  • программы ОС и тестовые программы (обеспечивают работу ЭВМ);
  • прикладные программы (обеспечивают решение набора функциональных задач);
  • библиотека стандартных программ.

Типы информационных массивов:

  • постоянные (формируются до начала работы системы - директивные, справочные, нормативные данные - не изменяемые во времени);
  • промежуточные (возникают как результат предыдущего расчета и основа для следующего);
  • текущие (содержат рабочую информацию о состоянии управляемого объекта);
  • служебные (обслуживают остальные массивы);
  • вспомогательные (возникают при операциях над основными массивами).

По виду носителя ИМ делятся на массивы на машинных (внутренних и внешних) и немашинных носителях.

Особенность ИМ - его структура, способ упорядочивания данных по ключевым признакам. Записи могут упорядочиваться по возрастанию или убыванию значения ключевого признака. В качестве ключевого выбирается наиболее часто встречающийся признак.

Модель обработки данных МОД. Она определяет организацию вычислительных процессов ОВП для решения задач пользователя. Последовательность и процедуры решения вычислительных задач должны быть оптимизированы с точки зрения критериев: объем памяти, ресурсы, числа обращений и т. д. Организация процесса впрямую зависит от предметной области. При разработке базовой ИТ прежде всего следует правильно выбрать ОС. Именно ОС задает реальные возможности по управлению вычислительным процессом.

Структура вычислительного процесса задается числом задач. Очень важными являются требования к моменту запуска и выпуска (выхода результатов) задач. Эти моменты определяют динамику получения результатов, то есть динамику всего процесса управления производством.

Первые ОС были ориентированы на пакетную обработку информации. Этот режим в принципе не пригоден для задач управления большой размерности и оперативности. Переход к системам разделения времени позволил в условиях прерывания отдавать предпочтение приоритетным задачам. Оказалось возможным планировать вычислительный процесс.

Новые возможности для пользователя заложены в виртуальных ОС. Она позволила пользователю иметь неограниченный вычислительный ресурс, не замечая работы соседних пользователей. В условиях распределенной обработки данных возникают новые требования к вычислительному процессу. Требуется не только распределить вычислительный ресурс между пользователями и их вычислительными задачами, но и учесть топологию пользователей.

При создании моделей организации вычислительного процесса (ОВП) используют два возможных подхода: детерминированный и вероятностный. При детерминированном подходе применяется теория расписаний очередности задач при накладываемых ограничениях. К сожалению, в этот удобный метод вмешиваются случайные помехи. Могут возникнуть непредвиденные задачи, требующие срочного решения. Для них выделяются дополнительные интервалы времени. При вероятностном подходе устанавливает средний вычислительный ресурс, среднее время выполнения программы, усредненная производительность вычислительной системы. Усредненные параметры рассчитываются на основании статистических данных и постоянно корректируются.

Если мы склонны к типизации решаемых вычислительных задач для конкретной ИТ, то очень большое значение имеет разработка пакетов прикладных программ (ППП).

Среди моделей обработки данных следует еще упомянуть имитационные модели. С их помощью решаются задачи планирования организации вычислительного процесса.

Модель представления знаний МПЗ. Модели представления знаний являются основой автоматизированного решения задач управления. Модели представления знаний существуют в виде логического Л, алгоритмического А, семантического С, фреймового Ф и интегрального И представлений.

Модель управления данными МУПД. Управление данными - управление процессами накопления, обмена и обработки данных. Накопление данных сейчас происходит в условиях современных бах данных, при этом управляющее воздействие должны обеспечить ввод информации, обновление ее, размещение массивов в БД. Эти функции осуществляет современная СУБД.

С появлением ЭВМ данные накапливались в виде совокупности одинаково построенных записей - файлов. При решении каждой новой задачи создавались новые файлы. Логическая связь между файлами отсутствовала. Возникала проблема целостности данных. Для каждого обращения к файлам создавалась своя программа. Отдельные данные в файлах дублировались. Совершенствование вычислительной техники и одновременно рост объемов информации привели к появлению концепции баз данных. В БД записи взаимосвязаны, могут совместно использоваться для решения все новых задач.

В зависимости от решаемых задач выбираются модели баз данных.

Современное производство решает огромное количество рутинных информационных задач. Но и очень велико количество задач, требующих информацию для принятия решения. Для этого требуется новые подходы к формированию данных, вводу и выводу их, обработке. Эти новые подходы реализуются с помощью новых ИТ, реализующих их взаимную организацию. Этой организацией ведает модель управления данными. Модель базируется на том, что данные обладают относительной стабильностью. Стабильность структуры данных дает возможность строить базы со стабильной структурой. А получаемую информацию отображать в виде переменных значений данных в этой стабильной структуре.

В соответствии с моделью предметной области может быть сформирован класс данных для всех решаемых задач. На логическом уровне предметная БД включает в себя логические записи, их элементы и взаимосвязь между ними.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие к одному» и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), в ее основе лежит математическое понятие теоретико-множественного отношения, она базируется на реляционной алгебре и теории отношений.

Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным методом управления. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.

По наиболее характерным признакам БД можно классифицировать следующим образом:

по способу хранения информации:

  • интегрированные;
  • распределенные;

по типу пользователя:

  • монопользовательские;
  • многопользовательские;

по характеру использования данных:

  • прикладные;
  • предметные.

В настоящее время при проектировании БД используют два подхода. Первый из них основан на стабильности данных, что обеспечивает наибольшую гибкость и адаптируемость к используемым приложениям. Применение такого подхода целесообразно в тех случаях, когда не предъявляются жесткие требования к эффективности функционирования (объему памяти и продолжительности поиска), существует большое число разнообразных задач с изменяемыми и непредсказуемыми запросами.

Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эффективности функционирования, особенно это касается быстродействия.

Другим важным аспектом проектирования БД является проблема интеграции и распределения данных. Господствовавшая до недавнего времени концепция интеграции данных при резком увеличении их объема, оказалась несостоятельной. Этот факт, а также увеличение объемов памяти внешних запоминающих устройств при их удешевлении, широкое внедрение сетей передачи данных способствовало внедрению распределенных БД. Распределение данных по месту их использования может осуществляться различными способами:

  1. Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи данных. Модификация данных контролируется централизованно;
  2. Подмножество данных. Группы данных, совместимые с исходной базой данных, хранятся отдельно для местной обработки;
  3. Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень;
  4. Секционированные данные. На различных объектах используются одинаковые структуры, но хранятся разные данные;
  5. Данные с отдельной подсхемой. На различных объектах используются различные структуры данных, объединяемые в интегрированную систему;
  6. Несовместимые данные. Независимые базы данных, спроектированные без координации, требующие объединения.

Важное влияние на процесс создания БД оказывает внутреннее содержание информации. Существует два направления:

  • прикладные БД, ориентированные на конкретные приложения, например, может быть создана БД для учета и контроля поступления материалов;
  • предметные БД, ориентированные на конкретный класс данных, например, предметная БД «Материалы», которая может быть использована для различных приложений.

Конкретная реализация системы баз данных с одной стороны определяется спецификой данных предметной области, отраженной в концептуальной модели, а с другой стороны типом конкретной СУБД (МБД), устанавливающей логическую и физическую организацию.

Для работы с БД используется специальный обобщенный инструментарий в виде СУБД (МБД), предназначенный для управления БД и обеспечения интерфейса пользователя.

Основные стандарты СУБД:

  • независимость данных на концептуальном, логическом, физическом уровнях;
  • универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);
  • совместимость, неизбыточность;
  • безопасность и целостность данных;
  • актуальность и управляемость.

Существуют два основных направления реализации СУБД: программное и аппаратное.

Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением конкретной ОС и выполняет следующие функции:

  • описание данных на концептуальном и логическом уровнях;
  • загрузку данных;
  • хранение данных;
  • поиск и ответ на запрос (транзакцию);
  • внесение изменений;
  • обеспечение безопасности и целостности.

Обеспечивает пользователя следующими языковыми средствами:

  • языком описания данных (ЯОД);
  • языком манипулирования данными (ЯМД);
  • прикладным (встроенным) языком данных (ПЯД, ВЯД).

Аппаратная реализация предусматривает использование так называемых машин баз данных (МБД). Их появление вызвано возросшими объемами информации и требованиями к скорости доступа. Слово «машина» в термине МБД означает вспомогательный периферийный процессор. Термин «компьютер БД» - автономный процессор баз данных или процессор, поддерживающий СУБД.

Основные направления МБД:

  • параллельная обработка;
  • распределенная логика;
  • ассоциативные ЗУ;
  • конвейерные ЗУ;
  • фильтры данных и др.

Совокупность процедур проектирования БД можно объединить в четыре этапа. На этапе формулирования и анализа требований устанавливаются цели организации, определяются требования к БД. Эти требования документируются в форме, доступной конечному пользователю и проектировщику БД. Обычно при этом используется методика интервьюирования персонала различных уровней управления.

Этап концептуального проектирования заключается в описании и синтезе информационных требований пользователей в первоначальный проект БД. Результатом этого этапа является высокоуровневое представление информационных требований пользователей на основе различных подходов.

В процессе логического проектирования высокоуровневое представление данных преобразуется в структуре используемой СУБД. Полученная логическая структура БД может быть оценена количественно с помощью различных характеристик (число обращений к логическим записям, объем данных в каждом приложении, общий объем данных и т.д.). На основе этих оценок логическая структура может быть усовершенствована с целью достижения большей эффективности.

На этапе физического проектирования решаются вопросы, связанные с производительностью системы, определяются структуры хранения данных и методы доступа.

Весь процесс проектирования БД является итеративным, при этом каждый этап рассматривается как совокупность итеративных процедур, в результате выполнения которых получают соответствующую модель.

Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проектирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования.

Этап расчленения БД связан с разбиением ее на разделы и синтезом различных приложений на основе модели. Основными факторами, определяющими методику расчленения, являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использования приложения и его моделью.

Модели приложений могут быть классифицированы следующим образом:

  1. Приложения, использующие единственный файл.
  2. Приложения, использующие несколько файлов, в том числе:

Допускающие независимую параллельную обработку;

Допускающие синхронизированную обработку.

Сложность реализации этапа размещения БД определяется многовариантностью. Поэтому на практике рекомендуется в первую очередь рассмотреть возможность использования определенных допущений, упрощающих функции СУБД, например, допустимость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др. Такие допущения оказывают большое влияние на выбор СУБД и рассматриваемую фазу проектирования.

Средства проектирования и оценочные критерии используются на всех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становится инструментальным средством проектирования, практически не подверженным влиянию стиля проектирования.

В настоящее время неопределенность при выборе критериев является наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа альтернативных решений. При этом следует иметь в виду, что существует много признаков оптимальности, являющихся неизмеримыми, им трудно дать количественную оценку или представить их в виде целевой функции. Поэтому оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в такие категории, представлены ниже.

Количественные критерии: время, необходимое для ответа на вопрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию.

Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.

Трудность в оценке проектных решений связана также с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимым изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Предназначение склада данных - информационная поддержка принятия решений, а не оперативная обработка данных. Потому база данных и склад данных не являются одинаковыми понятиями.

Основные функции репозитариев:

  • парадигма включения/выключения и некоторые формальные процедуры для объектов;
  • поддержка множественных версий объектов и процедуры управления конфигурациями для объектов;
  • оповещение инструментальных и рабочих систем об интересующих их событиях;
  • управление контекстом и разные способы обзора объектов репозитария;
  • определение потоков работ.

Рассмотрим кратко основные направления научных исследований в области баз данных:

  • развитие теории реляционных баз данных;
  • моделирование данных и разработка конкретных моделей разнообразного назначения;
  • отображение моделей данных, направленных на создание методов их преобразования и конструирования коммутативных отображений, разработку архитектурных аспектов отображения моделей данных и спецификаций определения отображений для конкретных моделей данных;
  • создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей;
  • разработка, выбор и оценка методов доступа;
  • создание самоописываемых баз данных, позволяющих применить единые методы доступа для данных и метаданных;
  • управление конкурентным доступом;
  • развитие системы программирования баз данных и знаний, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными;
  • совершенствование машины баз данных;
  • разработка дедуктивных баз данных, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных баз данных;
  • интеграция неоднородных информационных ресурсов.

А также другие работы, которые могут Вас заинтересовать

46498. Эхинококкоз печени. Клиника, диагностика, методы хирургического лечение 17.71 KB
Эхинококкоз печени. При перкуссии расширения границ печени.Периоды развития: латентный продромальных явлений прогрессивное увеличение печени период осложнений.
46499. Анализ прибыли предприятия 17.72 KB
Прибыль предприятия характеризует превышение если наоборот то убыток выручки над расходами является главным показателем эффективности деятельности и отражает цель предпринимательства. В зависимости способа вычисления и направлений распределения различают такие основные виды прибыли предприятия: валовую балансовую прибыль операционную прибыль прибыль от обычной деятельности и прибыль после налогообложения чистую прибыль.Валовая балансовая прибыль Gross Profit разность между чистым доходом от реализации продукции и себестоимостью...
46500. Понятие и методы калькуляции затрат 17.86 KB
Калькуляция служит основой для определения средних издержек производства и установления себестоимости продукции. Методы калькуляции это методы расчёта издержек производства себестоимости продукции объёма незавершённого производства основанные на калькуляции затрат. Попередельный метод калькуляции это метод исчисления себестоимости применяемый на предприятиях где исходный материал в процессе производства проходит ряд переделов или где из одних исходных материалов в одном технологическом процессе получают различные виды продукции....
46501. Техническое диагностирование. Этапы комплексной диагностики участков МТ. 17.87 KB
Основными задачами контроля и диагностики МТ являются определение технического состояния на основе комплексного мониторинга в процессе создания и эксплуатации системы оценка и прогнозирование динамики технического состояния с целью обеспечения надежной и безопасной эксплуатации газотранспортной системы. Контроль и мониторинг технического состояния трубопроводных систем включает: получение информации в предэксплуатационный период ранняя диагностика из проектных материалов включая материалы изысканий лабораторных исследований грунтов...
46502. Диаграммы UML 17.91 KB
Диаграммы UML. UML определяет следующие диаграммы: 1. Диаграммы применения use cse Или диаграммы вариантов использования Представляют собой граф из действующих лиц ctors и их взаимодействие с системой представленное сценариями применения. Диаграммы классов Cодержат набор статических декларативных элементов как например классы типы их связи объединенные в граф.
46503. Обеспечение электробезопасности техническими способами и СЗ 17.91 KB
При случайном прикосновении для обеспечения электробезопасности применяют: защитные оболочки защитные ограждения временные или стационарные безопасное расположение токоведущих частей изоляцию этих частей и РМ малое U защитное отключение предупредительную сигнализацию блокировку и знаки безопасности; а при прикосновении к нетоковедущим металлическим частям защитное заземление зануление выравнивание потенциала защитное отключение изоляцию нетоковедущих частей электроразделение сети малое U контроль электроизоляции и СИЗ....
46504. Формы производственной деятельности фирмы 17.98 KB
Различают три основные формы организации производства: Специализация Кооперирование Комбинирование Специализация производства Специализация производства выражается в том что каждое производство ограничивается изготовлением определённого вида конструктивной и технологически однородной продукции. Соответственно этому различают четыре вида специализации предприятий: предметную; подетальную иногда называют узловая; технологическую; по услугам вспомогательного производства. Подетальная специализация характеризуется...
46505. Природа грамматического значения: общая характеристика, отношение к лексическому значению, функциональный статус 18.04 KB
Природа грамматического значения: общая характеристика отношение к лексическому значению функциональный статус. Большинство слов обладает двумя значениями: лексическим и грамматическим. В области морфологии это общие значения слов как частей речи напр. значения предметности у существительных процессуальное у глаголов а также частные значения словоформ и слов в целом противопоставляемые друг другу в рамках морфологических категорий например значения того или иного времени лица числа рода.
46506. Поверхностное упрочнение детали. Выбор метода поверхностного упрочнения 18.07 KB
При обработке поверхности шлифованием и полированием устраняющей неровности которые служат концентраторами напряжений повышается усталостная прочность детали. Назначение метода упрочняющей обработки зависит от условий работы детали в машине и ее технологических особенностей. Деталь помещают внутри спирали индуктора или под проводником по которому пропускается переменный ток большой частоты; он вызывает появление вихревых токов на поверхности детали и быстро разогревает слой с наибольшей плотностью индуцированного тока.

Под хранением информации (от хранить – содержать в безопасности/целости ) следует понимать содержание информации во внешней памяти компьютера.

С хранением информации связаны такие понятия, как носитель информации (память), внутренняя память, внешняя память, хранилище информации. Носитель информации – это физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг человека). Ее можно назвать внутренней памятью, поскольку ее носитель – мозг – находится внутри человека. Все прочие виды носителей информации можно назвать внешними (по отношению к человеку). Виды этих носителей менялись со временем от камня до бумаги. Развитие информационной техники привело к созданию магнитных, оптических и других современных видов носителей информации.

Хранилище информации – это определенным образом организованная совокупность данных на внешних носителях, предназначенная для длительного хранения и постоянного использования. Примерами хранилищ являются архивы документов, библиотеки, справочники, картотеки. Основной информационной единицей хранилища является определенный физический документ – анкета, книга, дело, досье, отчет и пр. Под организацией хранилища понимается наличие определенной структуры, т.е. упорядоченность, классификация хранимых документов. Такая организация необходима для удобства ведения хранилища: пополнения его новыми документами, удаления ненужных документов, поиска информации и пр.

Знания, хранящиеся в памяти человека, можно рассматривать как внутреннее хранилище информации, однако организацию этого хранилища нам понять трудно. Основное свойство человеческой памяти – большая скорость воспроизведения хранящейся в ней информации. Но по сравнению с внешними хранилищами человеческая память менее надежна. Поэтому для более надежного хранения человек использует внешние носители, организует хранилища информации.

Основные свойства хранилища информации – объем хранимой информации, надежность хранения, время доступа (т.е. время поиска нужных сведений), наличие защиты информации.

Информацию, хранимую на устройствах компьютерной памяти, принято называть данными. Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами данных.

В современных компьютерах основными носителями информации для внешней памяти служат магнитные и оптические диски. Рассмотрим, каким образом организуется хранение информации на магнитных дисках. Такой подход оправдан тем, что оптические диски для этой цели стали использоваться гораздо позже, а потому ради обеспечения совместимости с магнитными устройствами они во многом имитируют структуру последних.



Размещение информации на носителях. Обычный магнитный диск имеет две поверхности, пригодные для размещения информации, которые в технической литературе принято называть сторонами (side) диска. Учитывая, что в накопителях на жестких дисках на одной оси могут устанавливаться несколько дисковых пластин, общее количество сторон может быть и больше .

Каждую поверхность обслуживает собственная магнитная головка (head). Все головки собраны в единый механический блок и могут двигаться вдоль радиуса дисков, причем движение это является дискретным, т.е. головки занимают относительно диска только строго определенные положения. Наконец, каждая дорожка разделена на отдельные секторы (sector) (рис. 1.4). Сектор является неделимой порцией информации и может быть прочитан только целиком. Последней координатой информации на диске служит номер требуемого байта в секторе.

Итак, положение байта информации на магнитном диске определяется четырьмя “координатами”: номером стороны, номером дорожки диска, номером сектора и номером байта в нем. Такая система хранения данных сложна и требует определенных усилий по их извлечению. Поэтому созданы специальные программы, которые позволяют пользователю извлекать необходимые данные, не требуя от него знания всех этих координат.

Единицы хранения данных. При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру, а при этом возникает необходимость дополнительно записывать адресные данные. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру .

Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких, как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т.п.), поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла. Очевидно, что имя файла должно быть уникальным, так как это обеспечивает однозначность доступа к данным.

Понятие о файловой структуре. Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ “\” (обратная косая черта).

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.

Пример записи полного имени файла:

<имя носителя>\<имя каталога1 >\...\<имя каталогаМ >\ <собственное имя файла>

Следует иметь в виду, что сектора с информацией одного файла совсем не обязательно располагаются по порядку в одном месте диска. При записи система активно использует свободные места, которые образуются при удалении ненужных файлов. В результате отдельные части файла вполне могут попасть в разные области диска, что будет заметно замедлять доступ к информации. Для устранения этого явления в состав операционных систем обычно входят специальные служебные программы дефрагментации файлов.

Такой подход к организации хранения данных исторически был обусловлен тем, что в качестве материального носителя данных использовались накопители на магнитных дисках. При этом поверхность диска, на которую осуществлялась запись данных, форматировалась: разбивалась на дорожки и сектора. Программы форматирования обеспечивали создание сектора объемом 512 байт. Таким образом, для записи данных, принадлежащих одному файлу, как правило, требуется нескольких секторов. На рисунке отчетливо видно, что сектора на внешних дорожках диска имеют больший размер, чем ближайшие к центру. Это дает основания считать, что данные дорожки должны записываться более надежно. Поэтому нулевая дорожка, которая служит для хранения наиболее важной системной информации, всегда размещается на внешнем кольце поверхности диска.



В продолжение темы:
Android

Веб-сервисы в 1СВ данной статье будет рассмотрены вопросы интеграции 1С с уже существующими веб-сервисами и использование самой 1С как веб-сервиса. При этом под веб-сервисами...